Apache Hadoop 为用户提供了构建和运行分布式应用程序的平台,无需深入了解底层细节。Hadoop 的核心组件 HDFS(Hadoop 分布式文件系统)具备高容错性,可在低成本硬件上部署,并提供高吞吐量数据访问,适用于处理海量数据集的应用程序。HDFS 不强制要求遵循 POSIX 标准,支持以流式方式访问文件系统数据。