这本实战指南对大数据及其相关技术的当前发展进行了全面总结,在保持理论深度的同时,强调实用价值。包含12个章节,涵盖了以下关键领域:

  • 大数据的定义、特征和发展历程
  • 数据获取和存储技术
  • 数据抽取、清洗和集成
  • 数据的查询、分析与建模方法
  • 异构数据采集技术
  • 文档存储与检索
  • 异种数据的统一访问和转换
  • 基于微博的股票市场预测系统实例
  • 海量视频检索系统实例
  • HDFS云文件系统实例