文章目录
Tokenizers(分词器)
Token Filters(字符过滤器)
Analyzer(分析器)
自定义Analyzer
带有停用词和同义词的分析器
带有除梗和停用词的分析器
3)带有特殊符号映射为特定单词的分析器
Elastic search 是一个能快速帮忙建立起搜索功能的,最好之一的引擎。
搜索引擎的构建模块 大都包含 tokenizers(分词器), token-filter(分词过滤器)以及 analyzers(分析器)。
这就是搜索引擎对数据处理和存储的方式,所以,通过上面的3个模块,数据就可以被轻松快速的查找。
下面讨论下, tokenizers(分词器), token-filter(分词过滤器)以及 analyzers(分析器)是如何工作的?
Tokenizers(分词器)
分词