Hadoop是Apache基金会的分布式系统基础架构,无需了解底层分布式细节即可开发分布式程序,充分利用集群进行高速运算和存储。Hadoop的分布式文件系统HDFS具有高容错性,适用于低廉硬件部署,提供高吞吐量数据访问,适用于超大数据集应用程序。HDFS放宽了POSIX要求,支持流式访问文件系统数据。
Hadoop权威指南第四版_中英文
相关推荐
Hadoop权威指南第四版修订版中英文PDF下载
Hadoop权威指南第四版修订版中英文PDF,高清版本,包含完整源码,适合大数据存储与分析。
Hadoop
4
2024-07-13
Hadoop 权威指南第四版 英文版
Hadoop 权威指南第四版,提供全彩内容。
Hadoop
2
2024-05-20
Hadoop权威指南第四版(英文版)
提供高清带目录的《Hadoop权威指南》第四版英文版。
Hadoop
2
2024-04-30
Hadoop权威指南(第四版)
Hadoop是Apache基金会开发的分布式系统架构,用户无需了解分布式底层细节,即可开发分布式程序。
它实现了分布式文件系统HDFS,具有高容错性,可部署在低成本硬件上。HDFS提供高吞吐量数据访问,适合处理超大数据集的应用程序。它放宽了POSIX要求,允许以流方式访问文件系统数据。
Hadoop
6
2024-05-01
Hadoop权威指南(第四版)
Hadoop权威指南(第四版)
提供高清中文版PDF,深入浅出地讲解Hadoop技术核心概念、架构和应用。
Hadoop
5
2024-05-15
Hadoop 权威指南 第四版
Tom White 著Hadoop 权威指南 第四版
Hadoop
6
2024-05-20
Hadoop 权威指南第四版
深入理解 Hadoop 生态系统,掌握大数据处理核心技术。
Hadoop
2
2024-05-20
Hadoop 权威指南(第四版)
高清完整版,深入解析 Hadoop 相关知识。
Hadoop
3
2024-05-21
Hadoop权威指南(第四版)
Hadoop权威指南(第四版)
掌握数据的力量。借助这本综合指南的第四版,您将学习如何使用Apache Hadoop构建和维护可靠、可扩展的分布式系统。
本书适合希望分析任何规模数据集的程序员,以及希望设置和运行Hadoop集群的管理员。
作者Tom White独家使用Hadoop 2,介绍了关于YARN的新章节以及一些与Hadoop相关的项目,例如Parquet、Flume、Crunch和Spark。您将了解Hadoop的最新变化,并探索关于Hadoop在医疗保健系统和基因组数据处理中的作用的新案例研究。
学习内容:
MapReduce、HDFS和YARN等基本组件
深入了解MapReduce,包括使用它开发应用程序的步骤
在YARN上设置和维护运行HDFS和MapReduce的Hadoop集群
学习两种数据格式:用于数据序列化的Avro和用于嵌套数据的Parquet
使用数据提取工具
Hadoop
3
2024-05-21