Impala

Cloudera开发的查询系统软件
Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在HadoopHDFSHBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性。相比之下,Impala的最大特点也是最大卖点就是它的快速。

优点

Impala不需要把中间结果写入磁盘,省掉了大量的I/O开销。
通过使用LLVM来统一编译运行时代码,避免了为支持通用编译而带来的不必要开销。
C++实现,做了很多有针对性的硬件优化,例如使用SSE指令。