您当前的位置:首页 > 电脑百科 > 程序开发 > 架构

如何通过Elasticsearch创建索引库?

时间:2020-09-18 15:57:15  来源:  作者:
  • Elasticsearch作为一门全文检索技术,那它是如何使用的呢?
  • 先学习Elasticsearch的一些语法,后续再在项目中实战应用。

一、IK分词器

这个IK分词器有什么用?为什么要用它?

要知道计算机是老美搞出来的,它的很多东西对于中文来说其实是很不友好的。

关于分词,即把一段中文或者别的划分成一个个的关键字。

比如"我是中国人",可以分为多少个词?

按照中国汉字语言,其分为“我”,“是”,“中国人”,“中国”,“国人”这5个。

也就是说用户输入上述5个词语,都可以搜索到“我是中国人”这条数据。

而默认的中文分词是将每个字看成一个词,会被分为“我”,“是”,"中","国","人"。

这显然是不符合要求的,所以用中文分词器ik来解决这个问题。

如何通过Elasticsearch创建索引库?

 

①analyze:翻译过来就是分析的意思,这里就可以理解成分词。

②analyzer:这里也就是指分词器,我们使用ik_max_word

  • ik_max_word为最细粒度划分。
  • ik_smart为最少切分。

这是ik分词器提供的两个分词算法,至于具体是如何实现的,就要去研究它的算法了。

可以把上述代码修改做一个对比,会发现使用ik_smart只能分三个词:“我”,“是”,“中国人”

这里显然使用ik_max_word更加的合适。

二、基本概念

Elasticsearch本质上也就是在存储数据,其有很多概念可以和MySQL类似的。

如何通过Elasticsearch创建索引库?

 

为了方便学习将其和MySQL结合起来。

当然严格来说将这些概念对应起来不太准确,但目前就这样理解也没问题。

①索引库indices

  • MySQL中通过数据库存储数据。
  • Elasticsearch中通过索引库存储索引。

indices本身也就是索引indexs的复数写法。

②类型type

  • 一个数据库中可以创建多张表,比如说商品表,订单表。
  • 一个索引集也可以有不同类型的索引,比如说商品索引,订单索引。

不过这有一个缺陷是会导致索引库混乱,未来版本中会移除这个概念,emm…也不知道现在移除这个概念没有,目前还没来得及查。

③文档document

  • 数据库中一条数据就是一行。
  • 索引集中一条信息就是一个文档

④字段field

  • 数据库中列就是每一行中的数据。
  • 索引集中字段就是文档中的属性。

弄清楚了这些概念,接下来创建索引库。

三、操作索引库

昨天我们也说明过了,Elasticsearch是一个基于RESTful风格的搜索引擎

Elasticsearch采用的是REST风格API,其API本质上也就是一次http请求:

1索引库的创建

如何通过Elasticsearch创建索引库?

 

既然是请求,那自然就会有:

  • 请求方式:PUT,其对应的就是创建。
  • 请求路径:/索引库名
  • 请求参数:这里是settings

这里settings是指索引库的设置:

  • number_of_shards:分片数量。
  • number_of_rplicas:副本数量。

这个呢就涉及到了一些集群相关的概念,后续具体使用到的时候再做说明。

2索引库的查询与删除

REST风格的方便之处就在于通过请求方式的不同就能实现不同的操作:

如何通过Elasticsearch创建索引库?

 

①查询索引库

请求方式GET对应的就是查询操作。

请求路径依旧是上述创建的索引库,可以查询出liuxiaoai01索引库的信息。

②删除索引库

请求方式DELETE对应的就是删除操作。

请求路径依旧是上述创建的索引库,可以删除liuxiaoai01索引库。

删除后再次使用GET查询对应的索引库,会发现其会报错了,证明删除成功。

四、操作字段映射

创建了索引库也就相当于有了database数据库,接下来就是数据表并添加数据了。

1类型的创建

如何通过Elasticsearch创建索引库?

 

在索引库中添加数据叫映射,这也是上述格式中_mApping的由来。

goods就是索引类型,也就是相当于数据库中的goods数据表。

properties也就是属性,其下添加对应的字段,上述中就有title,images,price三个字段,可以设置许多属性:

  • type:int、long、short、date、integer、text、string……等多个。
  • index:根据语义理解就是是否被作为索引?
  • analyzer:也就是分词器。

这个type是字段数据类型:int、long这些是数字类型,text、string是字符串类型。

  • 若是text类型,默认会分词。
  • 若是String类型,默认不会分词,上述中写的keyword和String一回事,翻译过来是关键字的意思,关键字肯定不能再分了,更好理解。

2类型的查询

如何通过Elasticsearch创建索引库?

 

PUT对应着新增操作,GET也就对应着查询操作了,关于类型没有删除和修改操作。

就相当于不能删除和修改数据表的名称,这点倒是和MySQL数据库不一样。

其查询到的索引之间的映射关系也很清楚:

索引库叫liuxiaoai01,通过mappings映射有goods这个索引类型,该类型下properties中有3个字段。

基本上知道了其单词意思也就知道其作用了。

注意关于这个type不要弄混了:

  • goods对应的是索引类型,相当于数据表。
  • 上述多个类型对应的是字段的数据类型。

最后

行有不得反求诸己,我是@刘小爱



Tags:Elasticsearch   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
一、环境准备1.1、环境列表 节点名称 系统 ip地址 es-node1 centos7.6 192.168.10.128 es-node2 centos7.6 ...【详细内容】
2021-07-03  Tags: Elasticsearch  点击:(117)  评论:(0)  加入收藏
Elasticsearch(简称ES) 是一个分布式、高扩展、高实时的搜索与数据分析引擎,它也是一个“存储库”。它能很方便地使大量数据具有搜索、分析和探索的能力。充分利用 ES 的水平伸...【详细内容】
2021-06-22  Tags: Elasticsearch  点击:(89)  评论:(0)  加入收藏
作者:LX 一、 环境搭建 1、 启动Spark集群服务 1)启动Spark集群 2)子节点加入集群 3)查看是否加入成功 2、启动Elasticsearch数据库 1)可以启动自己安装的Elasticsearch数据库...【详细内容】
2021-06-11  Tags: Elasticsearch  点击:(132)  评论:(0)  加入收藏
环境:elasticsearch7.8.0索引模板通过事先定义好的模板,在创建索引时,如果索引名称与模版中定义的索引模式匹配那么就会自动应用模版中的配置信息。如果有多个索引模板被匹配,那...【详细内容】
2021-05-27  Tags: Elasticsearch  点击:(203)  评论:(0)  加入收藏
作者:中华石杉来源:石杉的架构笔记(ID:shishan100)目录:1. 一道面试题的引入:2. 性能优化的杀手锏:Filesystem Cache3. 数据预热4. 冷热分离5. ElasticSearch 中的关联查询6. Docum...【详细内容】
2021-03-04  Tags: Elasticsearch  点击:(133)  评论:(0)  加入收藏
基本概念定义 一个分布式的实时文档存储,每个字段 可以被索引与搜索 一个分布式实时分析搜索引擎 能胜任上百个服务节点的扩展,并支持 PB 级别的结构化或者非结构化数据用途 ...【详细内容】
2020-11-09  Tags: Elasticsearch  点击:(119)  评论:(0)  加入收藏
时下不论是在全文搜索领域还是大数据即时处理领域ELK都一枝独秀,而ELK的核心在于Elasticsearch,ELK很秀源于Elasticsearch很棒。很多可能用过ELK但是对其核心Elasticsearch却...【详细内容】
2020-10-26  Tags: Elasticsearch  点击:(80)  评论:(0)  加入收藏
1. 简述 Elasticsearch 是基于 Lucene 开发的一个分布式全文检索框架,向 Elasticsearch 中存储和从 Elasticsearch 中查询,格式是json。 向 Elasticsearch 中存储数据,其实...【详细内容】
2020-10-12  Tags: Elasticsearch  点击:(58)  评论:(0)  加入收藏
Elasticsearch作为一门全文检索技术,那它是如何使用的呢? 先学习Elasticsearch的一些语法,后续再在项目中实战应用。一、IK分词器这个IK分词器有什么用?为什么要用它?要知道计算...【详细内容】
2020-09-18  Tags: Elasticsearch  点击:(115)  评论:(0)  加入收藏
随着移动互联网、物联网、云计算等信息技术蓬勃发展,数据量呈爆炸式增长。如今我们可以轻易得从海量数据里找到想要的信息,其中离不开搜索引擎技术的帮助。...【详细内容】
2020-09-11  Tags: Elasticsearch  点击:(114)  评论:(0)  加入收藏
▌简易百科推荐
为了构建高并发、高可用的系统架构,压测、容量预估必不可少,在发现系统瓶颈后,需要有针对性地扩容、优化。结合楼主的经验和知识,本文做一个简单的总结,欢迎探讨。1、QPS保障目标...【详细内容】
2021-12-27  大数据架构师    Tags:架构   点击:(3)  评论:(0)  加入收藏
前言 单片机开发中,我们往往首先接触裸机系统,然后到RTOS,那么它们的软件架构是什么?这是我们开发人员必须认真考虑的问题。在实际项目中,首先选择软件架构是非常重要的,接下来我...【详细内容】
2021-12-23  正点原子原子哥    Tags:架构   点击:(7)  评论:(0)  加入收藏
现有数据架构难以支撑现代化应用的实现。 随着云计算产业的快速崛起,带动着各行各业开始自己的基于云的业务创新和信息架构现代化,云计算的可靠性、灵活性、按需计费的高性价...【详细内容】
2021-12-22    CSDN  Tags:数据架构   点击:(10)  评论:(0)  加入收藏
▶ 企业级项目结构封装释义 如果你刚毕业,作为Java新手程序员进入一家企业,拿到代码之后,你有什么感觉呢?如果你没有听过多模块、分布式这类的概念,那么多半会傻眼。为什么一个项...【详细内容】
2021-12-20  蜗牛学苑    Tags:微服务   点击:(8)  评论:(0)  加入收藏
我是一名程序员关注我们吧,我们会多多分享技术和资源。进来的朋友,可以多了解下青锋的产品,已开源多个产品的架构版本。Thymeleaf版(开源)1、采用技术: springboot、layui、Thymel...【详细内容】
2021-12-14  青锋爱编程    Tags:后台架构   点击:(20)  评论:(0)  加入收藏
在了解连接池之前,我们需要对长、短链接建立初步认识。我们都知道,网络通信大部分都是基于TCP/IP协议,数据传输之前,双方通过“三次握手”建立连接,当数据传输完成之后,又通过“四次挥手”释放连接,以下是“三次握手”与“四...【详细内容】
2021-12-14  架构即人生    Tags:连接池   点击:(16)  评论:(0)  加入收藏
随着移动互联网技术的快速发展,在新业务、新领域、新场景的驱动下,基于传统大型机的服务部署方式,不仅难以适应快速增长的业务需求,而且持续耗费高昂的成本,从而使得各大生产厂商...【详细内容】
2021-12-08  架构驿站    Tags:分布式系统   点击:(23)  评论:(0)  加入收藏
本系列为 Netty 学习笔记,本篇介绍总结Java NIO 网络编程。Netty 作为一个异步的、事件驱动的网络应用程序框架,也是基于NIO的客户、服务器端的编程框架。其对 Java NIO 底层...【详细内容】
2021-12-07  大数据架构师    Tags:Netty   点击:(16)  评论:(0)  加入收藏
前面谈过很多关于数字化转型,云原生,微服务方面的文章。虽然自己一直做大集团的SOA集成平台咨询规划和建设项目,但是当前传统企业数字化转型,国产化和自主可控,云原生,微服务是不...【详细内容】
2021-12-06  人月聊IT    Tags:架构   点击:(23)  评论:(0)  加入收藏
微服务看似是完美的解决方案。从理论上来说,微服务提高了开发速度,而且还可以单独扩展应用的某个部分。但实际上,微服务带有一定的隐形成本。我认为,没有亲自动手构建微服务的经历,就无法真正了解其复杂性。...【详细内容】
2021-11-26  GreekDataGuy  CSDN  Tags:单体应用   点击:(35)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条