Hadoop是Apache基金会开发的分布式系统基础架构,允许用户在不需了解分布式底层细节的情况下开发程序。它利用集群进行高速运算和存储,实现了高容错性的分布式文件系统(HDFS)。HDFS设计用于低成本硬件部署,提供高吞吐量访问大数据集,适合处理超大数据集的应用程序。与传统文件系统不同,HDFS支持流式数据访问,放宽了POSIX要求。