iconv - PHP中UTF8和UTF-8可以混用吗?

php中文网
发布: 2016-06-06 20:51:49
原创
1909人浏览过

同事使用iconv进行编码转换时使用的时utf8,而不是utf-8,我测试了下发现utf8和utf-8在iconv和mb_str中结果是一样的,如: iconv('utf8', 'gb2312', '测试');iconv('utf-8', 'gb2312', '测试');。但是google了下发现也有人因为使用utf8而不是utf-8遇到问题的情况 http://readyfighting.com/archives/156。

那么请问二者使用起来有什么不同吗?

回复内容:

同事使用iconv进行编码转换时使用的时utf8,而不是utf-8,我测试了下发现utf8和utf-8在iconv和mb_str中结果是一样的,如: iconv('utf8', 'gb2312', '测试');iconv('utf-8', 'gb2312', '测试');。但是google了下发现也有人因为使用utf8而不是utf-8遇到问题的情况 http://readyfighting.com/archives/156。

那么请问二者使用起来有什么不同吗?

根据 libiconv-1.14/lib/encodings.def , UTF-8和UTF8都会被识别成utf8编码,所以没有区别,所以所有使用libiconv的程序都没问题,比如php的iconv库。

立即学习PHP免费学习笔记(深入)”;

/* General multi-byte encodings */

DEFENCODING(( "UTF-8",                  /* IANA, RFC 2279 */
            /*"UTF8",                      JDK 1.1 */
            /*"CP65001",                   Windows */
            ),   
            utf8,
            { utf8_mbtowc, NULL },        { utf8_wctomb, NULL })
#ifdef USE_HPUX_ALIASES
DEFALIAS(     "UTF8",                   /* HP-UX */
            utf8)
#endif
登录后复制

根据 ext/mbstring 的 mbfilter_utf8.c ,UTF-8 (作为name/mimename) 和 UTF8 (作为alias)也都可以被识别,所以也一样。

static const char *mbfl_encoding_utf8_aliases[] = {"utf8", NULL};

const mbfl_encoding mbfl_encoding_utf8 = { 
    mbfl_no_encoding_utf8,
    "UTF-8",
    "UTF-8",
    (const char *(*)[])&mbfl_encoding_utf8_aliases,
    mblen_table_utf8,
    MBFL_ENCTYPE_MBCS
};
登录后复制

顺便说一下,mysql不识别 utf-8,必须用utf8。

mysql> create table t1 (id int primary key, name int) character set utf-8;ERROR 1115 (42000): Unknown character set: 'utf'

你好,我在windows环境下测试了一行代码

mPDF
mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),包括边距、边框、填充、行高、背景颜色等。支持从右到左的语言,并自动检测文档中的RTL字符。转置表格、列表、文本

mPDF 24
查看详情 mPDF
iconv('UTF8', 'GB2312', '测试');
登录后复制

得到一个警告

Notice: iconv(): Wrong charset, conversion from `UTF8' to `GB2312' is not allowed
登录后复制

这说明应该使用UTF-8这种形式才是正确的。

mbstring.supported-encodings 提到的mbstring支持的编码中也只有UTF-8这种形式。

或许是你可以尝试修改一下php.ini

error_reporting = E_ALL | E_STRICT
display_errors = On
登录后复制

也许就可以看到警告信息了。

根据felix021的提示,再测试两行代码

print_r(mb_list_encodings());
print_r(mb_encoding_aliases('UTF8'));
登录后复制

可知mb中的确是做为别名处理了。

相关标签:
php
PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号