本书详尽总结了当前大数据及其相关技术的发展,内容涵盖大数据的概念、特点和发展历史,数据获取、存储、抽取、清洗、集成以及查询、分析、建模等方面。同时还介绍了异构数据采集、文档存储与检索、异种数据的统一访问与转换等技术,并结合微博股票市场预测和海量视频检索系统的实例,以及HDFS云文件系统等实用案例。适合大数据技术初学者、从业人员和研究人员,也是高校相关专业的教学参考书。