我的替换词库来源于一个文本文件。文本文件无论改成gbk还是utf-8格式都出现乱码。
如果把替换词库自己定义如下:
$words = array('发文说'=>'DDDDDDDDDDDDDDDDDDDd');
替换就不会出现乱码
$data['content'] = strtr($data['content'], $words);
我把words变量打印出来,里面的词组都没有乱码,用函数检测,也不是utf-8格式。所以可以确认,内容和替换词组都是gbk格式的字符串。
请问如何解决这个问题?谢谢
你词库的格式?你如何读词库的?
你词库的格式?你如何读词库的?
$data_file = PICK_DATA.'/word.txt';$handle = fopen($data_file, "r");$data = fread($handle, filesize($data_file));
你词库的格式?你如何读词库的?
我在网上搜索,得到答案说: 因为strtr在字符串替换的时候是以单个字节对应进行替换的,所以对于非单字节编码的数据(如中文utf-8)就可以会出现乱码。
但是我的字符串都是gbk呀。而且我以前也用这个函数,没出现乱码。到这里就出现乱码了,不知道为何。
你没有说你的词库是如何组织的
不多只要你的原词有单个汉字的话,乱码的概率一般不会低于50%
你没有说你的词库是如何组织的
不多只要你的原词有单个汉字的话,乱码的概率一般不会低于50%
问题找到了。我切割字符的时候用的是\n,而不是\r\n。这就是造成乱码的原因。感谢回答。
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号