Apache Hadoop YARN是大数据应用的现代分布式操作系统。它将Hadoop计算层变形为一个通用的资源管理平台,可以托管各种各样的应用程序。许多组织利用YARN在Hadoop上构建他们的应用程序,无需反复担心资源管理、隔离、多租户等问题。Hadoop分布式文件系统(HDFS)是Hadoop应用程序使用的主要数据存储系统。它采用NameNode和DataNode架构实现分布式文件系统,为高度可扩展的Hadoop集群提供高性能数据访问。