Hive是基于Hadoop的数据仓库工具,可将结构化数据文件映射为数据库表,提供简单的SQL查询功能,能将SQL语句转换为MapReduce任务运行。其优点是学习成本低,通过类SQL语句快速实现简单的MapReduce统计,无需开发专门的MapReduce应用,非常适合数据仓库的统计分析。