Hadoop是Apache基金会的分布式系统基础架构,无需了解底层分布式细节即可开发分布式程序,充分利用集群进行高速运算和存储。Hadoop的分布式文件系统HDFS具有高容错性,适用于低廉硬件部署,提供高吞吐量数据访问,适用于超大数据集应用程序。HDFS放宽了POSIX要求,支持流式访问文件系统数据。