更多>
最新下载
24小时阅读排行榜
- 1 豆包AI免费写作工具入口 豆包AI写作助手app登录官网
- 2 VSCode Emmet快捷键使用技巧
- 3 苹果手机如何恢复Safari书签
- 4 现代JavaScript模块化开发实践与演进
- 5 Python代码如何进行数据可视化 Python代码使用Matplotlib库的实战指南
- 6 如何查看mysql的日志
- 7 html语言如何列表_HTML列表(ul/ol/dl)创建与样式设置方法
- 8 京东外卖商家装修怎么操作?京东如何装修店铺
- 9 夸克AI搜索简体中文官网地址 夸克最新设置与入口指南
- 10 c++怎么用asan, tsan, ubsan进行运行时检查_C++三大运行时检测工具使用指南
- 11 mongodb如何查询不包含某个字符串
- 12 vscode如何同步工作区设置_vscode工作区设置同步方法与技巧
- 13 Java正则表达式:灵活控制字母、数字与特定分隔符的组合验证
- 14 Golang如何在并发场景下优化内存分配
- 15 vscode全局替换如何避免覆盖重要内容_vscode重要内容保护与全局替换技巧
更多>
最新教程
-
- Node.js 教程
- 7201 2025-08-28
-
- CSS3 教程
- 1018650 2025-08-27
-
- Rust 教程
- 11435 2025-08-27
-
- Vue 教程
- 13658 2025-08-22
-
- PostgreSQL 教程
- 10472 2025-08-21
-
- Git 教程
- 5081 2025-08-21
下载首页 / 类库下载 / 其它类库
<?php
class Segmentation {
var $options = array('lowercase' => TRUE,
'segment_english' => FALSE);
var $dict_name = 'Unknown';
var $dict_words = array();
function setLowercase($value) {
if ($value) {
$this->options['lowercase'] = TRUE;
} else {
$this->options['lowercase'] = FALSE;
}
return TRUE;
}
function setSegmentEnglish($value) {
if ($value) {
$this->options['segment_english'] = TRUE;
} else {
$this->options['segment_english'] = FALSE;
}
return TRUE;
}中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂得多、困难得多
本站所有资源都是由网友投搞发布,或转载各大下载站,请自行检测软件的完整性!本站所有资源仅供学习与参考,请勿用于商业用途,否则产生的一切后果将由您自己承担!如有侵权请联系我们删除下架,联系方式:admin@php.cn

