Hadoop引入了分布式文件系统(Hadoop Distributed File System,简称HDFS)。HDFS具备高度容错性,专为低成本硬件设计;同时,它提供高吞吐量,能够有效访问应用程序的数据,非常适合处理大规模数据集。HDFS在满足数据流访问的同时,松弛了对POSIX的遵循要求。