Elasticsearch—生产环境集群核心配置
  TEZNKK3IfmPf 2023年11月14日 76 0

一. Elasticsearch相关配置

path.data 和 path.log

这两个配置的目录分别用来存放​​索引数据​​​和​​日志​​​,它们的默认路径位于​​$_ES_HOME​​的子文件夹内。这样有很大风险,特别是在升级Elasticsearch版本时,这些数据很可能被删除,在生产环境中可参考下面的配置

path:
logs: /var/log/elasticsearch
data: /var/data/elasticsearch

另外path.data支持配置多个目录,每个目录都会用来存放数据,但是单个分片会存放在同一个目录内,多目录配置参考

path:
data:
- /mnt/elasticsearch_1
- /mnt/elasticsearch_2
- /mnt/elasticsearch_3

集群名称

默认情况下集群名为​​elasticsearch​​,为了区分不同集群,在生产环境需要进行修改。每个节点需要配置相同的集群名才能加入同一个集群中,且每个节点只能加入一个集群,要保证集群名相同,否则会加入错误的集群中。

cluster.name: test-cluster

节点名称

默认情况下节点名称是操作系统的主机名,在Linux下使用​​hostname -f​​​可查看主机名。也可通过​​elasticsearch.yml ​​配置文件显示的配置,使可读性更好。配置示例如下

node.name: test-node

网络地址 network.host

默认配置下,Elasticsearch绑定的是一个环回地址​​127.0.0.1 ​​​,这只适合在单机开发时使用。在正式环境中,为了保证该节点能够被其它节点找到,形成一个集群,需要设置一个非环回地址,如果在内网中部署集群,可通过​​ifconfig​​命令查看当前节点的内网ip地址。配置如下

network.host: 192.168.60.11

服务发现和集群形成设置

1. 服务发现种子主机 discovery.seed_hosts

在开发环境中,服务发现主机名不需要设置,Elasticsearch默认会从本机的9300-9305端口尝试去连接其它节点,这提供了自动集群的体验,不需要任何配置。但在正式环境中,每个节点理论上都是不同的机器,这时候需要配置​​discovery.seed_hosts​​​,​​discovery.seed_hosts​​​可以是​​ip​​​、​​ip:端口​​​和​​域名​​​。如果配置是ip,Elasticsearch默认会使用​​transport.profiles.default.port​​配置项的端口,该端口默认为9300;如果配置是域名,且该域名下绑定了多个ip,ES会尝试去连接多个ip。下面是配置示例

discovery.seed_hosts:
- 192.168.1.10:9300
- 192.168.1.11
- seeds.mydomain.com

2. 初始主节点 cluster.initial_master_nodes

当开启一个全新的集群时,会有一个集群的引导步骤,这步骤用来确定哪些节点参与第一次的主节点选举。在开发模式下,这个步骤由节点自动完成,这种模式本质上是不安全的,因为不是所有节点都适合做主节点,主节点关系到集群的稳定性。因此在生产模式下,集群第一次启动时,需要有一个适合作为主节点的节点列表,这个列表就是通过​​cluster.initial_master_nodes​​​来配置,在配置中需要写出具体的节点名称,对应​​node.name​​配置项。配置示例如下

cluster.initial_master_nodes: 
- master-node-a
- master-node-b
- master-node-c

设置堆内存容量

默认情况下,Elasticsearch中JVM堆内存的最小值和最大值为1GB,在生产模式下,堆内存容量是非常重要的,需要确保Elasticsearch有足够的堆内存可用。我们可以在​​jvm.options ​​​配置文件中,通过配置​​Xmx ​​​和​​Xms​​​项来决定JVM堆内存容量,配置的容量本身也取决于服务器的物理内存,​​Xmx ​​​和​​Xms​​的值不超过物理内存的50%。因为Elasticsearch除了堆内存,也会有其它的操作,比如使用堆外缓冲区进行网络通信,通过操作系统的文件系统缓存来访问文件,还有JVM自身也需要一些内存。对内存容量,最大可设置接近32GB,26GB是安全值,有些系统下可到达30GB。示例配置如下

-Xms2g 
-Xmx2g

二. 操作系统配置

文件描述符

Linux默认配置下最大打开文件数为1024,可通过​​ulimit -n​​查看,而ES在建索引过程中会打开很多小文件,这样很容易超过限制,文件描述符临时设置命令如下

sudo su  
ulimit -n 65535
su elasticsearch

永久设置可修改​​/etc/security/limits.conf​​文件

elasticsearch - nofile 65535

上面的配置表示设置elasticsearch用户下,打开文件描述符最大数量为65535。

禁止交换空间

Linux的交换空间机制是指,当内存资源不足时,Linux把某些页的内容转移至硬盘上的一块空间上,以释放内存空间。硬盘上的那块空间叫做交换空间(swap space)。如果不关闭swap,Elasticsearch的堆内存可能会被挤到磁盘中,垃圾回收速度会从毫秒级别变成分钟级别,导致节点的响应速度慢甚至和集群断开连接。有三种方式来避免交换空间发生

1.禁止所有交换空间

在Linux上,临时关闭操作系统交换空间可执行下面命令

sudo swapoff -a

永久关闭需要修改​​/etc/fstab ​​文件。

2.配置swappiness

修改 ​​/etc/sysctl.conf​​​文件,设置​​vm.swappiness = 1​​,可以使Linux在一般情况下不使用交换,除非万不得已。

3.使用内存锁

使用内存锁可以在ES启动时,锁住一段堆内存,保证堆内存不被挤到磁盘中,对应Linux中的​​mlockall ​​​系统调用,在ES中配置​​config/elasticsearch.yml ​​文件。配置如下

bootstrap.memory_lock: true

虚拟内存

Elasticsearch通过文件映射(mmap)来读取磁盘中的文件,这样可以比​​read​​​系统调用少一次内存拷贝,也被称为0拷贝技术。ES映射的文件会很多,所以需要修改最大映射文件的数量,通过修改​​vm.max_map_count​​配置项可实现。临时修改可调用下面命令

sysctl -w vm.max_map_count=262144

要永久修改这个值,需要修改​​/etc/sysctl.conf​​文件,增加如下行

vm.max_map_count=262144

然后再运行​​sysctl -p ​​​重新加载系统配置才会生效,最后运行​​sysctl vm.max_map_count​​命令检测设置是否生效。

设置线程

Elasticsearch中不同的操作有不同的线程池,为了确保Elasticsearch线程正常创建线程,需要设置操作系统的线程数限制。最小值为4096,可通过修改​​/etc/security/limits.conf​​来完成设置。

总结

以上的配置在生产环境中都很重要,大部分参考了官方文档,结合了自己的理解,如有描述错误的地方,请指正。希望对你有帮助,谢谢!

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月14日 0

暂无评论

推荐阅读
  TEZNKK3IfmPf   2024年05月31日   52   0   0 linux服务器
  TEZNKK3IfmPf   2024年05月31日   30   0   0 linux服务器centos
  TEZNKK3IfmPf   2024年05月31日   29   0   0 linuxbind
  TEZNKK3IfmPf   2024年05月31日   40   0   0 linuxshell
TEZNKK3IfmPf