impala简介
  PqigEuuArTBs 2023年11月02日 30 0


 

 

 

 

impala 是运行于现有Hadoop基础设施上的实时互动SQL查询引擎,从而使hadoop  hbase的数据支持实时查询,
这意味着Impala为Hadoop打开了通向关系型数据库和传统商业智能工具的大门(后两者基于SQL查询)。
是Cloudera公司主导开发的新型查询系统.

 

传统hive仅支持30%的sql,而且是转换为mr,效率较低。

impala组成部分:  1 Impala实时查询引擎,采用Apache开源授权方式,Hadoop用户可以单独使用这个引擎.
Impala不再使用缓慢的 Hive+MapReduce批处理,
而是通过与商用并行关系数据库中类似的分布式查询引擎(由Query Planner、Query Coordinator和Query Exec Engine三部分组成),
可以直接从HDFS或者HBase中用SELECT、JOIN和统计函数查询数据,从而大大降低了延迟。

 

 

结构图:

 

impala简介_数据


 

 

 

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
  ehrZuhofWJiC   2024年05月31日   28   0   0 数据库
PqigEuuArTBs