本文主要介绍了如何使用IKAnalyzer分词器自定义扩展词典,希望大家可以耐心学习。
下载ikanalyzer完整分发包后,ik analyzer安装包包含:
1. 《ikanalyzer中文分词器v2012使用手册》
2. ikanalyzer2012.jar(主jar包)
3. ikanalyzer.cfg.xml(分词器扩展配置文件)
4. stopword.dic(停止词典)
5. license.txt ; notice.txt (apache版权申明)
它的安装部署十分简单,将 ikanalyzer2012.jar 部署于项目的 lib 目录中;
ikanalyzer.cfg.xml 与 stopword.dic 文件放置在 class 根目录(对于 web 项目,通常是
web-inf/classes目录,同hibernate、log4j等配置文件相同)下即可。
要扩展自定义词典,打开IKAnalyzer.cfg.xml

将扩展词典的注释去掉。

同时在class根目录,即src文件夹下自己新建ext.dic文件。建好之后用Notepad++软件打开ext.dic。

相关推荐:
以上就是如何使用IKAnalyzer分词器自定义扩展词典的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号