Impala 是一种新式查询系统,由 Cloudera 领导开发,可查询 PB 级大数据,这些数据存储在 Hadoop 的 HDFS 和 HBase 中。Impala 提供 SQL 语义,比 Hive 更快,后者虽然也提供 SQL 语义,但其底层执行引擎 MapReduce 是一个批处理过程。