<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict"></entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords"></entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
7.17.1系列Elasticsearch的elasticsearch-analysis-ik分词器
需积分: 0 12 浏览量
更新于2023-08-07
收藏 4.3MB ZIP 举报
适用于7.17.1系列,例如Elasticsearch的7.17.12版本。
elasticsearch-analysis-ik 是一个常用的中文分词器,在 Elasticsearch 中广泛应用于中文文本的分析和搜索。下面是 elasticsearch-analysis-ik 分词器的几个主要特点:
中文分词:elasticsearch-analysis-ik 是基于最大正向匹配算法实现的中文分词器。它能够将中文文本按照合理的单词边界进行分割,并提供高质量的分词结果。
词库扩展性:elasticsearch-analysis-ik 采用了可扩展的词库机制。用户可以根据自己的需求,定制和扩展词库,添加新的词汇,从而实现更好的分词效果。
多种分词模式:elasticsearch-analysis-ik 支持多种分词模式,包括细粒度切分和智能切分。细粒度切分会将文本切分为更小的词汇单位,而智能切分则会根据上下文进行适当的切分,更符合语义的需求。
中文数字处理:elasticsearch-analysis-ik 还针对中文文本中的数字进行了特殊处理。它将连续的数字组合成一个整体。
qq_15145603
- 粉丝: 459
- 资源: 8
最新资源
- 三菱PLC采用Fx3u一485ADP一MB通讯模块,进行MODBuS和欧姆龙温控器通讯程序,程序采用ADPRW指令,通讯程序简单,易入门,适合小白使用
- 中达优控一体屏台达程序,包含中达优控屏程序,plc程序,程序 结构清晰,注释完整
- OV12890-Product-Specification-COB-Version-2-23-meetvr.pdf
- PMSM永磁同步电机仿真三电平SVPWM矢量控制matlab PMSM双环矢量控制传统三电平
- 基于最小二乘支持向量机(LSSVM)的数据分类预测 LSSVM分类 matlab代码 只代码,不负责讲解 注:要求 Matlab 2018B 及以上版本
- 基于深度置信网络-支持向量机(DBN-SVM)的数据分类预测 matlab代码
- cruise纯电动仿真模型纯电动车实际项目模型,本模型基于Cruise软件和Simul ink软件共同搭建完成
- 2025苹果cmsv10短剧模板.zip
- 两部6层电梯西门子S7-200PLC梯形图程序 一、电梯具有的功能 1.电梯内选和外选按钮的呼叫与对应指示灯的显示功能; 2.电梯开门和关门动作,开门到位; 3.电梯上升和下降的动作; 4
- 员工绩效考核系统 JAVA+Vue+SpringBoot+MySQL
- 数据库开发工具-脚本自动生成
- 基于51单片机的示波器 基于单片机AT89C51、模数转芯片ADC0808、proteus模拟的信号发生器、液晶屏LCD12864的简易示波器 功能: 可以通过按键调节波形的频率和峰值,将波形发生
- 基于改进粒子群优化支持向量机(PSO-SVM)的时间序列预测 PSO-SVM时间序列 改进后粒子群权重为:线性权重递减 matlab代码 只代码,不负责讲解 注:暂无Matlab版本要求 - 推荐
- 数据分析-76-TED演讲数据集探索之可视化分析(包含代码和数据)
- 基于卷积神经网络-双向长短期记忆网络(CNN-BILSTM)时间序列预测,MATLAB代码 评价指标包括:R2、MAE、MS
- 视频网站系统源代码.zip