学习大数据时面临的主要挑战之一是信息过载和技术更新迭代。本书独特之处在于系统整理了Hadoop生态系统中最典型的框架和工具,帮助读者深入理解它们的功能及其在整体体系中的作用。第一部分:基础知识 第1章:介绍 第2章:HDFS和MapReduce 第二部分:存储与查询 第3章:Apache Hive 第4章:Apache HBase 第三部分:批量传输与流式处理 第5章:Apache Sqoop 第6章:Apache Flume 第四部分:序列化处理 第7章:Apache Avro 第8章:Apache Parquet 第五部分:消息传递与索引 第9章:Apache Kafka 第10章:Apache Solr 第11章:Apache Mahout