Hive应用实例:WordCount词频统计任务要求:首先,需要创建一个需要分析的输入数据文件然后,编写HiveQL语句实现WordCount算法具体步骤如下:
(1)创建input目录,其中input为输入目录。命令如下:
$ cd /usr/local/hadoop
$ mkdir input
(2)在input文件夹中创建两个测试文件file1.txt和file2.txt,命令如下:
$ cd /usr/local/hadoop/input
$ echo \"hello world\" > file1.txt
$ echo \"hello hadoop\" > file2.txt