您当前的位置：首页 > 电脑百科 > 程序开发 > 编程百科

ElasticSearch写入数据时的索引过程分析

时间：2019-09-29 13:24:51 来源：作者：

+ 加入收藏

索引过程图解

api向集群发送索引请求，集群会使用负载均衡节点来处理该请求，如果没有单独的负载均衡点，master节点会充当负载均衡点的角色。
负载均衡节点根据routing参数来计算要将该索引存储到哪个primary shard上，然后将数据给到对应的shard。
对应的shard拿到数据后进行索引写入，写入成功后，将数据给到自己的replica shard。
当replica shard也将数据成功写入后，返回成功的结果到负载均衡节点。
此时负载均衡节点才认为数据写入成功，将成功索引的结果返回给请求的api

routing(路由)参数

1、routing参数的指定和计算原理

每个document存放在哪个shard上是由routing参数决定的，那这个参数的值是什么，ElasticSearch又是怎么通过该参数来确定存放在哪个shard上呢？

routing参数的默认值为_id，也可以进行手动指定routing参数，可以是值，也可以是某个字段:

PUT /index/type/id?routing=user_id
{
 "user_id":"M9472323048",
 "name":"zhangsan",
 "age":54
}

ElasticSearch有个哈希算法，通过 Hash(routing) % number_of_shards算得存储到哪个shard上面去，比如上面的语句，假设Hash("M9472323048") = 23，该index含有3个shard，则存储到 23 % 3 = 2，即P2上面。shard编号取值为0 number_of_shards - 1。

2、手动指定routing和自动routing的区别

routing的值默认为_id字段，_id可以保证在集群中唯一，但是有时候需要手动指定routing来优化后续的查询过程。因为routing确定，那就可以指定用哪个routing进行查询，缩减了目标结果集，减少了ElasticSearch集群的压力。

使用自动routing:

优点: 简单，可以很均衡的分配每个shard中的文档数量，做到负载均衡

缺点: 当查询一下复杂的数据时，需要到多个shard中查找，查询偏慢

使用手动routing:

优点: 查询时指定当初入库的routing进行查询，锁定shard，直达目标，查询速度快

缺点: 麻烦，要保证存储的均衡比较复杂

Tags：ElasticSearch 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

Dokcer安装elasticsearch集群

一、环境准备1.1、环境列表节点名称系统 ip地址 es-node1 centos7.6 192.168.10.128 es-node2 centos7.6 ...【详细内容】

2021-07-03　　Tags: ElasticSearch 点击:(117)　　评论:(0)　　加入收藏

Elasticsearch部署的这些问题，你遇到过吗？

Elasticsearch（简称ES）是一个分布式、高扩展、高实时的搜索与数据分析引擎，它也是一个“存储库”。它能很方便地使大量数据具有搜索、分析和探索的能力。充分利用 ES 的水平伸...【详细内容】

2021-06-22　　Tags: ElasticSearch 点击:(89)　　评论:(0)　　加入收藏

流数据存储之Elasticsearch

作者：LX 一、环境搭建 1、启动Spark集群服务 1）启动Spark集群 2）子节点加入集群 3）查看是否加入成功 2、启动Elasticsearch数据库 1）可以启动自己安装的Elasticsearch数据库...【详细内容】

2021-06-11　　Tags: ElasticSearch 点击:(134)　　评论:(0)　　加入收藏

Elasticsearch索引模板 & 索引别名 & _source字段 & 节点类型

环境：elasticsearch7.8.0索引模板通过事先定义好的模板，在创建索引时，如果索引名称与模版中定义的索引模式匹配那么就会自动应用模版中的配置信息。如果有多个索引模板被匹配，那...【详细内容】

2021-05-27　　Tags: ElasticSearch 点击:(203)　　评论:(0)　　加入收藏

亿级数据毫秒级查询！ElasticSearch是怎么做到的？

作者：中华石杉来源：石杉的架构笔记（ID:shishan100）目录：1. 一道面试题的引入：2. 性能优化的杀手锏：Filesystem Cache3. 数据预热4. 冷热分离5. ElasticSearch 中的关联查询6. Docum...【详细内容】

2021-03-04　　Tags: ElasticSearch 点击:(133)　　评论:(0)　　加入收藏

花几分钟看一下Elasticsearch原理解析与性能调优

基本概念定义一个分布式的实时文档存储，每个字段可以被索引与搜索一个分布式实时分析搜索引擎能胜任上百个服务节点的扩展，并支持 PB 级别的结构化或者非结构化数据用途 ...【详细内容】

2020-11-09　　Tags: ElasticSearch 点击:(120)　　评论:(0)　　加入收藏

Elasticsearch全攻略

时下不论是在全文搜索领域还是大数据即时处理领域ELK都一枝独秀，而ELK的核心在于Elasticsearch，ELK很秀源于Elasticsearch很棒。很多可能用过ELK但是对其核心Elasticsearch却...【详细内容】

2020-10-26　　Tags: ElasticSearch 点击:(80)　　评论:(0)　　加入收藏

一文读懂 Java操作Elasticsearch

1. 简述 Elasticsearch 是基于 Lucene 开发的一个分布式全文检索框架，向 Elasticsearch 中存储和从 Elasticsearch 中查询，格式是json。向 Elasticsearch 中存储数据，其实...【详细内容】

2020-10-12　　Tags: ElasticSearch 点击:(58)　　评论:(0)　　加入收藏

如何通过Elasticsearch创建索引库？

Elasticsearch作为一门全文检索技术，那它是如何使用的呢？先学习Elasticsearch的一些语法，后续再在项目中实战应用。一、IK分词器这个IK分词器有什么用？为什么要用它？要知道计算...【详细内容】

2020-09-18　　Tags: ElasticSearch 点击:(116)　　评论:(0)　　加入收藏

10分钟快速入门海量数据搜索引擎Elasticsearch

随着移动互联网、物联网、云计算等信息技术蓬勃发展，数据量呈爆炸式增长。如今我们可以轻易得从海量数据里找到想要的信息，其中离不开搜索引擎技术的帮助。...【详细内容】

2020-09-11　　Tags: ElasticSearch 点击:(115)　　评论:(0)　　加入收藏

▌简易百科推荐

深入理解glibc malloc：malloc() 与 free() 原理图解

本文分为三个等级自顶向下地分析了glibc中内存分配与回收的过程。本文不过度关注细节，因此只是分别从arena层次、bin层次、chunk层次进行图解，而不涉及有关指针的具体操作。前...【详细内容】

2021-12-28　　linux技术栈　　　　Tags:glibc 　点击:(3)　　评论:(0)　　加入收藏

最完整的Vue教程-从零开始编写可视化大屏

摘要（OF作品展示）OF之前介绍了用python实现数据可视化、数据分析及一些小项目，但基本都是后端的知识。想要做一个好看的可视化大屏，我们还要学一些前端的知识（vue），网上有很多比...【详细内容】

2021-12-27　　项目与数据管理　　　　Tags:Vue 　点击:(2)　　评论:(0)　　加入收藏

程序的执行流程和开发工具介绍

程序是如何被执行的&emsp;&emsp;程序是如何被执行的？许多开发者可能也没法回答这个问题，大多数人更注重的是如何编写程序，却不会太注意编写好的程序是如何被运行，这并不是一个好...【详细内容】

2021-12-23　　IT学习日记　　　　Tags:程序　点击:(9)　　评论:(0)　　加入收藏

单点登录(SSO)看这一篇还不够！这次不慌了

阅读收获✔️1. 了解单点登录实现原理✔️2. 掌握快速使用xxl-sso接入单点登录功能一、早期的多系统登录解决方案单系统登录解决方案的核心是cookie，cookie携带会话id在浏览器...【详细内容】

2021-12-23　　程序yuan　　　　Tags:单点登录( 　点击:(8)　　评论:(0)　　加入收藏

手把手教你构建一个简单的Eclipse RCP应用

下载Eclipse RCP IDE如果你电脑上还没有安装Eclipse，那么请到这里下载对应版本的软件进行安装。具体的安装步骤就不在这赘述了。创建第一个标准Eclipse RCP应用（总共分为六步）1...【详细内容】

2021-12-22　　阿福ChrisYuan　　　　Tags:RCP应用　点击:(7)　　评论:(0)　　加入收藏

浅析 Token 价值的意义及来源

今天想简单聊一聊 Token 的 Value Capture，就是币的价值问题。首先说明啊，这个话题包含的内容非常之光，Token 的经济学设计也可以包含诸多问题，所以几乎不可能把这个问题说的清...【详细内容】

2021-12-21　　唐少华TSH　　　　Tags:Token 　点击:(10)　　评论:(0)　　加入收藏

在VUE中实现效果"换一换"功能

实现效果：假如有10条数据，分组展示，默认在当前页面展示4个，点击换一批，从第5个开始继续展示，到最后一组，再重新返回到第一组 data() { return { qList: [], //处理后...【详细内容】

2021-12-17　　Mason程　　　　Tags:VUE 　点击:(14)　　评论:(0)　　加入收藏

阿里资深软件测试工程师总结的这几点，让小白轻松搞懂性能调优

什么是性能调优？(what) 为什么需要性能调优？(why) 什么时候需要性能调优？(when) 什么地方需要性能调优？(where) 什么时候来进行性能调优？(who) 怎么样进行性能调优？(How) 硬件配...【详细内容】

2021-12-16　　软件测试小p　　　　Tags:性能调优　点击:(20)　　评论:(0)　　加入收藏

抖音防烧屏脚本 – Tasker 脚本分享，适用于 OLED 屏幕

Tasker 是一款适用于 Android 设备的高级自动化应用，它可以通过脚本让重复性的操作自动运行，提高效率。不知道从哪里听说的抖音 app 会导致 OLED 屏幕烧屏。于是就现学现卖，自...【详细内容】

2021-12-15　　ITBang　　　　Tags:抖音防烧屏　点击:(25)　　评论:(0)　　加入收藏

Rust 核心团队“有毒”

11 月 23 日，Rust Moderation Team（审核团队）在 GitHub 上发布了辞职公告，即刻生效。根据公告，审核团队集体辞职是为了抗议 Rust 核心团队（Core team）在执行社区行为准则和标准上...【详细内容】

2021-12-15　　InfoQ　　　　Tags:Rust 　点击:(25)　　评论:(0)　　加入收藏

推荐资讯

聊聊如何自定义数据脱	河南人到底有多爱吃面
人称“犬中四煞”的4	离婚后，约定每月给孩子
“三皇五帝”分别是哪	印度低种姓群体如何翻
日本研发“飞行摩托”	2021年Steam最畅销游

无相关信息