Hadoop是一款分布式处理大数据的软件框架,以其可靠、高效和可伸缩的特性闻名。其核心包括HDFS和MapReduce,而hadoop2.0引入了YARN。