如何使用HAProxy实现Impala的负载均衡
  pdddowW4fPp8 2023年11月02日 63 0

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。


1.文档编写目的




前面Fayson介绍过《​​如何使用Nginx实现Impala负载均衡​​》,正如之前所说Cloudera官网推荐并支持的负载均衡为HAProxy。所以Fayson就介绍一下如何使用HAProxy实现Impala服务的负载均衡。


  • 内容概述

1.HAProxy安装及启停

2.HAProxy配置Impala负载均衡

3.Impala shell及JDBC测试


  • 测试环境

1.CM和CDH版本为5.13.0

2.采用root用户操作

3.集群未启用Kerberos

4.HAProxy1.5.18


2.HAProxy安装及启停




1.在集群中选择一个节点,使用yum方式安装HAProxy服务

[root@ip-172-31-9-33 ~]# yum -y install haproxy

如何使用HAProxy实现Impala的负载均衡_h5


2.启动与停止HAProxy服务,并将服务添加到自启动列表

[root@ip-172-31-9-33 ~]# service haproxy start[root@ip-172-31-9-33 ~]# service haproxy stop[root@ip-172-31-9-33 ~]# chkconfig haproxy on

如何使用HAProxy实现Impala的负载均衡_负载均衡_02

如何使用HAProxy实现Impala的负载均衡_h5_03


3.HAProxy配置Impala负载均衡




1.将/etc/haproxy目录下的haproxy.cfg文件备份,新建haproxy.cfg文件,添加如下配置

#---------------------------------------------------------------------
# Example configuration for a possible web application. See the
# full configuration options online.
#
# http://haproxy.1wt.eu/download/1.4/doc/configuration.txt
#
#---------------------------------------------------------------------

#---------------------------------------------------------------------
# Global settings
#---------------------------------------------------------------------global
log 127.0.0.1 local2

chroot /var/lib/haproxy
pidfile /var/run/haproxy.pid
maxconn 4000
user haproxy
group haproxy
daemon

# turn on stats unix socket
stats socket /var/lib/haproxy/stats
#---------------------------------------------------------------------
# common defaults that all the 'listen' and 'backend' sections will
# use if not designated in their block
#---------------------------------------------------------------------defaults
mode http
log global
option httplog
option dontlognull
#option http-server-close
#option forwardfor except 127.0.0.0/8
option redispatch
retries 3
timeout http-request 10s
timeout queue 1m
timeout connect 10s
timeout client 1m
timeout server 1m
timeout http-keep-alive 10s
timeout check 10s
maxconn 3000
listen stats
bind 0.0.0.0:1080
mode http
option httplog
maxconn 5000
stats refresh 30s
stats uri /stats
listen impalashell
bind 0.0.0.0:25003
mode tcp
option tcplog
balance leastconn
server ip-172-31-9-33.fayson.com ip-172-31-9-33.fayson.com:21000 check
server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:21000 check
server ip-172-31-10-118.fayson.com ip-172-31-10-118.fayson.com:21000 check
listen impalajdbc
bind 0.0.0.0:25004
mode tcp
option tcplog
balance leastconn
server ip-172-31-9-33.fayson.com ip-172-31-9-33.fayson.com:21050 check
server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:21050 check
server ip-172-31-10-118.fayson.com ip-172-31-10-118.fayson.com:21050 check

如何使用HAProxy实现Impala的负载均衡_h5_04

主要配置了HAProxy的http状态管理界面、impalashell和impalajdbc的负载均衡。


2.重启HAProxy服务

[root@ip-172-31-9-33 haproxy]# service haproxy restart

如何使用HAProxy实现Impala的负载均衡_hive_05


3.浏览器访问http://{hostname}:1080/stats

如何使用HAProxy实现Impala的负载均衡_负载均衡_06

看到以上截图说明,已成功配置了Impala服务的负载均衡。


4.Impala Shell测试




使用多个终端同时访问,并执行SQL语句,查看是否会通过HAProxy服务自动负载到其它Impala Daemon节点


1.使用Impala shell访问HAProxy服务的25003端口,命令如下

[root@ip-172-31-6-148 ~]# impala-shell -i ip-172-31-9-33.fayson.com:25003

 

2.打开第一个终端访问并执行SQL

[root@ip-172-31-6-148 ~]# impala-shell -i ip-172-31-9-33.fayson.com:25003...[ip-172-31-9-33.fayson.com:25003] > select * from my_first_table;...
+----+------+| id | name |+----+------+| 1 | john |
| 2 | tom |
| 3 | jim |+----+------+
Fetched 3 row(s) in 7.20s[ip-172-31-9-33.fayson.com:25003] >

如何使用HAProxy实现Impala的负载均衡_h5_07


3.同时打开第二个终端访问并执行SQL

[root@ip-172-31-6-148 ~]# impala-shell -i ip-172-31-9-33.fayson.com:25003...[ip-172-31-9-33.fayson.com:25003] > select * from my_first_table;...
+----+------+| id | name |+----+------+| 2 | tom |
| 3 | jim |
| 1 | john |+----+------+
Fetched 3 row(s) in 1.81s[ip-172-31-9-33.fayson.com:25003] >

如何使用HAProxy实现Impala的负载均衡_负载均衡_08

通过以上测试可以看到,两个终端执行的SQL不在同一个Impala Daemon,这样就实现了Impala Daemon服务的负载均衡。


5.Impala JDBC测试




这里Java的测试工程就不详细描述如何创建了,前面的文章Fayson也有讲过。

1.配置JDBC的地址为HAProxy服务所在的IP端口为25004

如何使用HAProxy实现Impala的负载均衡_hive_09


2.运行代码,查看运行结果


如何使用HAProxy实现Impala的负载均衡_hive_10



为天地立心,为生民立命,为往圣继绝学,为万世开太平。

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。



推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。

如何使用HAProxy实现Impala的负载均衡_h5_11

原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操


【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
pdddowW4fPp8