ElasticSearch文档路由-摩杜云开发者社区

ElasticSearch文档路由

TEZNKK3IfmPf 2023年11月14日 19 0

elasticsearch 路由

es 是一个分布式系统，当我们存储一个文档到 es 上之后，这个文档实际上是被存储到 master 节点中的某一个主分片上。

例如新建一个索引，该索引有两个分片，0个副本，如下：

ElasticSearch文档路由

ElasticSearch文档路由

接下来，向该索引中保存一个文档：

PUT blog/_doc/a
{
  "title": "a"
}

文档保存成功后，可以查看该文档被保存到哪个分片中去了：

ElasticSearch文档路由

GET _cat/shards/blog?v

查看结果如下：

index shard prirep state   docs store ip        node
blog  1     p      STARTED    0  208b 127.0.0.1 slave01
blog  0     p      STARTED    1 3.6kb 127.0.0.1 master

从这个结果中，可以看出，文档被保存到分片 0 中。

那么 es 中到底是按照什么样的规则去分配分片的？

es 中的路由机制是通过 哈希算法，将具有相同哈希值的文档放到一个主分片中，分片位置的计算方式如下：

shard = hash(routing) % number_of_primary_shards

routing 可以是一个任意字符串，es 默认是将文档的 id 作为 routing 值，通过哈希函数根据 routing 生成一个数字，然后将该数字和分片数取余，取余的结果就是分片的位置。

默认的这种路由模式，最大的优势在于负载均衡，这种方式可以保证数据平均分配在不同的分片上。但是他有一个很大的劣势，就是查询时候无法确定文档的位置，此时它会将请求广播到所有的分片上去执行。另一方面，使用默认的路由模式，后期修改分片数量不方便。

当然开发者也可以自定义 routing 的值，方式如下：

ElasticSearch文档路由

PUT blog/_doc/b?routing=bntang
{
  "title": "b"
}

如果文档在添加时指定了 routing，则查询、删除、更新时也需要指定 routing。

ElasticSearch文档路由

GET blog/_doc/b?routing=bntang

自定义 routing 有可能会导致负载不均衡，这个还是要结合实际情况选择。

典型场景：

对于用户数据，我们可以将 userid 作为 routing，这样就能保证同一个用户的数据保存在同一个分片中，检索时，同样使用 userid 作为 routing，这样就可以精准的从某一个分片中获取数据。

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇：基于AWS CodePipeline全自动化蓝绿部署发布Web应用实践下一篇： MongoDB-索引

分享：

最后一次编辑于 2023年11月14日 0

暂无评论

推荐阅读

postgres elasticsearch fdw 学习

TEZNKK3IfmPf 2023年11月14日 31 0 0 postgres fdw elasticsearch

ES分布式搜索-索引库操作

TEZNKK3IfmPf 2024年03月22日 52 0 0 分布式 elasticsearch 大数据

es安装及使用

TEZNKK3IfmPf 2024年04月26日 27 0 0 搜索引擎 elasticsearch 大数据

K8s 简单集成 SkyWalking

TEZNKK3IfmPf 2023年11月14日 27 0 0 apache java kubernetes elasticsearch

使用postgres_fdw 串接elasticsearch fdw

TEZNKK3IfmPf 2023年11月14日 38 0 0 postgres fdw elasticsearch

route-static

TEZNKK3IfmPf 2024年03月29日 104 0 0 静态路由

elasticsearch报错：exceeds the [index.highlight.max_analyzed_offset] limit [1000000]

TEZNKK3IfmPf 2023年11月14日 36 0 0 elasticsearch 报错

lapis 路由

TEZNKK3IfmPf 2023年11月14日 26 0 0 路由

elasticsearch查询操作（API方式）

TEZNKK3IfmPf 2024年04月26日 60 0 0 java 搜索引擎 elasticsearch

ElasticSearch - 基础概念，以及和 mysql 的对比

TEZNKK3IfmPf 2024年03月29日 100 0 0 elasticsearch 大数据

django-urls.py路由分发

TEZNKK3IfmPf 2023年11月14日 19 0 0 django 路由

ElasticSearch - 基于 JavaRestClient 查询文档（match、精确、复合查询，以及排序、分页、高亮）

TEZNKK3IfmPf 2024年03月29日 41 0 0 elasticsearch 大数据

cube.js 支持 elasticsearch

TEZNKK3IfmPf 2023年11月14日 178 0 0 elasticsearch cube

【教你通透ELK】Elasticsearch 集群管理

I7JaHrFMuDsU 2024年04月26日 47 0 0 elasticsearch

ElasticSearch - 分布式搜索引擎底层实现——倒排索引

TEZNKK3IfmPf 2024年03月29日 31 0 0 elasticsearch

ElasticSearch - 在微服务项目中基于 RabbitMQ 实现 ES 和 MySQL 数据异步同步（考点）

TEZNKK3IfmPf 2024年03月30日 61 0 0 elasticsearch mysql

elasticsearch操作（语句方式）

TEZNKK3IfmPf 2024年04月26日 37 0 0 搜索引擎 elasticsearch 大数据

ElasticSearch - 基于 JavaRestClient 操作索引库和文档

TEZNKK3IfmPf 2024年03月29日 27 0 0 elasticsearch 大数据

Java ElasticSearch 操作

TEZNKK3IfmPf 2023年11月14日 87 0 0 java elasticsearch json

前端-vue基础95-Vue路由的基本使用

TEZNKK3IfmPf 2023年11月14日 22 0 0 vue 路由

TEZNKK3IfmPf

作者其他文章更多

使用代码获得所有适用于创建的transaction type

2024-06-14

C/C++ realloc()函数解析

2024-06-14

生成一个文件保存在指定的文件夹中思路 python

2024-06-14

Windows 10封装中出现“无法验证你的Windows安装”错误解决方法

2024-06-14

109-修改返回体的内容RestControllerAdvice

2024-06-14

C/C++ 判断进程是否存在

2024-06-14

使用面向对象重构之-使用接口完成行为抽象

2024-06-14

使用面向对象重构之-把抽象控制在一处：提高内聚性

2024-06-14

重操旧业障碍多

2024-06-14

关于关闭自动装配

2024-06-14

最新推荐更多

使用代码获得所有适用于创建的transaction type

2024-06-14

C/C++ realloc()函数解析

2024-06-14

生成一个文件保存在指定的文件夹中思路 python

2024-06-14

Windows 10封装中出现“无法验证你的Windows安装”错误解决方法

2024-06-14

109-修改返回体的内容RestControllerAdvice

2024-06-14

C/C++ 判断进程是否存在

2024-06-14

使用面向对象重构之-使用接口完成行为抽象

2024-06-14

使用面向对象重构之-把抽象控制在一处：提高内聚性

2024-06-14

重操旧业障碍多

2024-06-14

关于关闭自动装配

2024-06-14

使用面向对象重构之-从过程式设计到面向对象

2024-06-14

nodejs部署神器pm2的使用体验

2024-06-14

java虚拟机启动过程解析

2024-06-14

mysql-忘记密码时重置操作

2024-06-14

Callable和runnable的区别

2024-06-14

python的粘包和分包

2024-06-14

tftp文件服务（udp端口：69）

2024-06-14

C语言反汇编 - 流程控制与循环结构

2024-06-14

python-列表包字典-根据字典的某一个键的值来进行排序

2024-06-14

使用面向对象重构之-使用接口抽象完成不同维度的扩展

2024-06-14