Elasticsearch中什么是 tokenizer、analyzer、filter ?

    技术2022-07-13  73

    文章目录

    Tokenizers(分词器) Token Filters(字符过滤器) Analyzer(分析器) 自定义Analyzer 带有停用词和同义词的分析器 带有除梗和停用词的分析器 3)带有特殊符号映射为特定单词的分析器 Elastic search 是一个能快速帮忙建立起搜索功能的,最好之一的引擎。

    搜索引擎的构建模块 大都包含 tokenizers(分词器), token-filter(分词过滤器)以及 analyzers(分析器)。

    这就是搜索引擎对数据处理和存储的方式,所以,通过上面的3个模块,数据就可以被轻松快速的查找。

    下面讨论下, tokenizers(分词器), token-filter(分词过滤器)以及 analyzers(分析器)是如何工作的?

    Tokenizers(分词器)

    分词

    Processed: 0.015, SQL: 9