本书深入剖析Hadoop这一高性能的大数据处理和分析平台,结合理论和实践,由浅入深地介绍了其全面内容。全书分为5部分24章,第Ⅰ部分涵盖Hadoop基础知识,第Ⅱ部分专注于MapReduce技术,第Ⅲ部分讨论Hadoop的运维策略,第Ⅳ部分探索相关开源项目,第Ⅴ部分则提供了三个实际案例。
Hadoop权威指南第四版详细解读
相关推荐
Hadoop权威指南(第四版)内容解读
2009年4月,Doug Cutting在加州的Shed in the Yard,回顾了Hadoop的起源。Hadoop诞生于Nutch项目,当时他们团队致力于构建一个开源网络搜索引擎,却在管理少量计算机上的计算任务时遇到了难题。谷歌发表的GFS和MapReduce论文为他们指明了方向,因为这些系统正是为了解决Nutch所面临的问题而设计的。于是,Cutting和另一位开发者开始兼职尝试在Nutch中复刻这些系统。
他们成功地让Nutch在20台机器上运行,但很快意识到,要处理网络的海量数据,需要在数千台机器上运行,而且这项工作也超出了两位兼职开发者的能力范围。
大约在同一时间,雅虎对这个项目产生了兴趣,并迅速组建了一支Cutting也加入了的团队。他们将Nutch的分布式计算部分分离出来,命名为Hadoop。在雅虎的支持下,Hadoop迅速发展成为一项能够真正扩展到网络规模的技术。2006年,……
Hadoop
3
2024-05-23
Hadoop权威指南(第四版)
Hadoop是Apache基金会开发的分布式系统架构,用户无需了解分布式底层细节,即可开发分布式程序。
它实现了分布式文件系统HDFS,具有高容错性,可部署在低成本硬件上。HDFS提供高吞吐量数据访问,适合处理超大数据集的应用程序。它放宽了POSIX要求,允许以流方式访问文件系统数据。
Hadoop
6
2024-05-01
Hadoop权威指南(第四版)
Hadoop权威指南(第四版)
提供高清中文版PDF,深入浅出地讲解Hadoop技术核心概念、架构和应用。
Hadoop
5
2024-05-15
Hadoop 权威指南 第四版
Tom White 著Hadoop 权威指南 第四版
Hadoop
6
2024-05-20
Hadoop 权威指南第四版
深入理解 Hadoop 生态系统,掌握大数据处理核心技术。
Hadoop
2
2024-05-20
Hadoop 权威指南(第四版)
高清完整版,深入解析 Hadoop 相关知识。
Hadoop
3
2024-05-21
Hadoop权威指南(第四版)
Hadoop权威指南(第四版)
掌握数据的力量。借助这本综合指南的第四版,您将学习如何使用Apache Hadoop构建和维护可靠、可扩展的分布式系统。
本书适合希望分析任何规模数据集的程序员,以及希望设置和运行Hadoop集群的管理员。
作者Tom White独家使用Hadoop 2,介绍了关于YARN的新章节以及一些与Hadoop相关的项目,例如Parquet、Flume、Crunch和Spark。您将了解Hadoop的最新变化,并探索关于Hadoop在医疗保健系统和基因组数据处理中的作用的新案例研究。
学习内容:
MapReduce、HDFS和YARN等基本组件
深入了解MapReduce,包括使用它开发应用程序的步骤
在YARN上设置和维护运行HDFS和MapReduce的Hadoop集群
学习两种数据格式:用于数据序列化的Avro和用于嵌套数据的Parquet
使用数据提取工具
Hadoop
3
2024-05-21
Hadoop权威指南第四版
Hadoop权威指南提供高清PDF,适合大数据初学者提升实战能力,欢迎下载。
Hadoop
2
2024-07-13
Hadoop权威指南 第四版 资源
获取Hadoop入门知识,深入学习Hadoop 2.x核心概念及新特性!资源包含中英文PDF版本以及源码,涵盖YARN、Parquet、Flume、Crunch和Spark等前沿技术。
Hadoop
3
2024-05-23