Hadoop是Apache基金会开发的分布式系统架构,用户无需了解分布式底层细节,即可开发分布式程序。

它实现了分布式文件系统HDFS,具有高容错性,可部署在低成本硬件上。HDFS提供高吞吐量数据访问,适合处理超大数据集的应用程序。它放宽了POSIX要求,允许以流方式访问文件系统数据。