Apache Hadoop软件库允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它被设计成可以从单台服务器扩展到数千台机器,每台机器都提供本地计算和存储。该库本身被设计为检测和处理应用程序层的故障,而不是依靠硬件来提供高可用性,因此可以在一组计算机上提供高可用性服务,而这些计算机中的每一台都可能容易出现故障。