随着移动互联网、物联网及社交网络技术的迅速发展,全球数据量急剧增加,进入大数据时代。IBM将大数据定义为具有规模性、多样性和高速性三大核心特征的技术。Hadoop作为开源大数据处理平台,已成为行业标准之一,并被广泛应用于军事、教育、政府和金融等领域。本研究集中于对比分析Hadoop 1.0与2.0版本的基准性能,涵盖了HDFS读写性能、YARN资源调度性能和Hive复杂SQL查询性能。