Ubuntu Linux虚拟机Hadoop伪分布式配置及WordCount实例验证

前提条件

配置环境: 根据Hadoop版本要求，安装Java并配置环境变量。
下载Hadoop: 从Apache Hadoop官网下载对应版本的Hadoop。
解压Hadoop: 将下载的Hadoop解压到指定目录，例如 /usr/local/hadoop。
配置Hadoop:
- 修改hadoop-env.sh文件，设置JAVA_HOME环境变量。
- 修改core-site.xml文件，配置Hadoop文件系统地址、临时目录等。
- 修改hdfs-site.xml文件，配置Hadoop数据存储路径、副本数量等。
- 修改mapred-site.xml文件，配置MapReduce框架运行方式。
- 修改yarn-site.xml文件，配置YARN资源管理器地址、节点管理器地址等。
格式化HDFS: 执行命令 hdfs namenode -format 格式化Hadoop分布式文件系统。
启动Hadoop: 执行命令 start-dfs.sh 和 start-yarn.sh 启动Hadoop服务。

可以通过以下方式验证Hadoop伪分布式模式是否运行正常：