更多>
最新下载
24小时阅读排行榜
- 1 Unity怎么读取XML配置文件 C#解析XML数据
- 2 如何判断索引是否生效_mysql执行验证
- 3 Javascript的性能如何优化_有哪些关键的技巧?
- 4 如何在Golang中搭建版本控制环境_配置Git和代码仓库
- 5 如何将XML绑定到WPF的DataGrid控件
- 6 c++20协程是什么 c++ coroutine入门使用【前沿】
- 7 什么是mysql主从复制_mysql复制基本原理
- 8 如何理解JavaScript生成器_它如何简化异步流程控制
- 9 html5能否插入带水印的文档_html5水印文档嵌入与透明度设置【实操】
- 10 如何使用Golang读取二进制文件_处理非文本文件数据
- 11 为什么XML适合表示层次结构或树形结构的数据?
- 12 如何使用Golang内置errors包创建错误_简单生成标准error对象
- 13 mysql使用in查询是否走索引_mysql in索引使用说明
- 14 C++20中的协程(Coroutines)如何使用?(入门代码示例)
- 15 html5怎样设置搜索框在表单中必显_html5表单布局与搜索框位置【步骤】
更多>
最新教程
-
- Node.js 教程
- 14426 2025-08-28
-
- CSS3 教程
- 1541446 2025-08-27
-
- Rust 教程
- 22116 2025-08-27
-
- Vue 教程
- 24610 2025-08-22
-
- PostgreSQL 教程
- 21298 2025-08-21
-
- Git 教程
- 8400 2025-08-21
下载首页 / 类库下载 / 其它类库
<?php
class Segmentation {
var $options = array('lowercase' => TRUE,
'segment_english' => FALSE);
var $dict_name = 'Unknown';
var $dict_words = array();
function setLowercase($value) {
if ($value) {
$this->options['lowercase'] = TRUE;
} else {
$this->options['lowercase'] = FALSE;
}
return TRUE;
}
function setSegmentEnglish($value) {
if ($value) {
$this->options['segment_english'] = TRUE;
} else {
$this->options['segment_english'] = FALSE;
}
return TRUE;
}中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂得多、困难得多
本站所有资源都是由网友投搞发布,或转载各大下载站,请自行检测软件的完整性!本站所有资源仅供学习与参考,请勿用于商业用途,否则产生的一切后果将由您自己承担!如有侵权请联系我们删除下架,联系方式:admin@php.cn
