php中截取单个中文

php中文网
发布: 2016-06-06 20:15:05
原创
1605人浏览过

1、怎样将php中出现的中文字符一个一个截取出来,有没有不用mb_substr的方法。
2、比如我写一个统计文件中(单个文件超过100万字)中文各字符出现次数的,java中用charat方法即可遍历字符,程序写下来也就几秒,但是在php中用mb_库十分慢,等了好几分钟都没有结果。
3、附java实现的代码 java实现统计字符出现次数

回复内容:

1、怎样将php中出现的中文字符一个一个截取出来,有没有不用mb_substr的方法。
2、比如我写一个统计文件中(单个文件超过100万字)中文各字符出现次数的,java中用charat方法即可遍历字符,程序写下来也就几秒,但是在php中用mb_库十分慢,等了好几分钟都没有结果。
3、附java实现的代码 java实现统计字符出现次数

经测试,我的代码应该是没有问题的,请指正:

<code>     $str = file_get_contents("hong.txt");
     preg_match_all("/./u", $str, $arr);
     $store = [];
     foreach($arr[0] as $value){
         if(array_key_exists($value, $store)){
             $store[$value]++;
         }else{
             $store[$value] = 1;
         }   
     }   
     asort($store);
     var_dump($store);</code>
登录后复制

此段代码在php7环境下对红楼梦进行操作(148万字),总耗时0.464s。

中文字符串分隔

立即学习PHP免费学习笔记(深入)”;

启科网络PHP商城系统
启科网络PHP商城系统

启科网络商城系统由启科网络技术开发团队完全自主开发,使用国内最流行高效的PHP程序语言,并用小巧的MySql作为数据库服务器,并且使用Smarty引擎来分离网站程序与前端设计代码,让建立的网站可以自由制作个性化的页面。 系统使用标签作为数据调用格式,网站前台开发人员只要简单学习系统标签功能和使用方法,将标签设置在制作的HTML模板中进行对网站数据、内容、信息等的调用,即可建设出美观、个性的网站。

启科网络PHP商城系统 0
查看详情 启科网络PHP商城系统
<code><?php
$tempaddtext = "php对UTF8字体串进行单字分割返回数组";

$cind     = 0;
$arr_cont = array();
for ($i = 0; $i < strlen($tempaddtext); $i++) {
    if (strlen(substr($tempaddtext, $cind, 1)) > 0) {
        if (ord(substr($tempaddtext, $cind, 1)) < 192) {
            if (substr($tempaddtext, $cind, 1) != " ") {
                array_push($arr_cont, substr($tempaddtext, $cind, 1));
            }
            $cind++;
        } elseif (ord(substr($tempaddtext, $cind, 1)) < 224) {
            array_push($arr_cont, substr($tempaddtext, $cind, 2));
            $cind += 2;
        } else {
            array_push($arr_cont, substr($tempaddtext, $cind, 3));
            $cind += 3;
        }
    }
}

print_r($arr_cont);
</code>
登录后复制

试试这个

<code><?php
$str = "abc中国cn";
$keys = [];
for($i = 0, $l = strlen($str); $i < $l; $i++) {
    $key = ord($str[$i]);
    if ($key < 192) {
        $key = $str[$i];
    } else if ($key < 224) {
        $key = $str[$i] . $str[$i+1];
        $i ++;
    } else {
        $key = $str[$i] . $str[$i+1] . $str[$i+2];
        $i += 2;
    }
    if (! isset($keys[$key])) {
        $keys[$key] = 0;
    }
    $keys[$key]++;
}
print_r($keys);</code>
登录后复制

其实楼上的思路也没问题,但是代码效率不太好。我这个测试了一下,貌似有的字符识别不正常,还需要完善,只是给个思路而以。

这里有字符串截取、分割的终极解决方案。
点这里,点这里

用拓展理论上是最有效的方案,php代码能实现的一般都是正则来实现,在效率上是比不上拓展的。如果觉得慢回顾下算法。

相关标签:
php
PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号