查了下gb2312只能表示简体中文(6000多个汉字),而gbk是gb2312的扩展(兼容gb2312),可以表示(2万多个汉字)。
<html>
<head>
<title></title>
<meta charset="gb2312">
</head>
<body>
简体中文
繁體中文
</body>
</html>
运行上面代码的时候,发现繁體中文可以正常显示的,并不会乱码,哪里错了吗?
查了下gb2312只能表示简体中文(6000多个汉字),而gbk是gb2312的扩展(兼容gb2312),可以表示(2万多个汉字)。
<html>
<head>
<title></title>
<meta charset="gb2312">
</head>
<body>
简体中文
繁體中文
</body>
</html>
运行上面代码的时候,发现繁體中文可以正常显示的,并不会乱码,哪里错了吗?
在 Windows 上,GB2312 是 cp936 的别名,它是 GBK 或者 GB18030 我不太清楚了。
在其它平台,GB2312 还是真正的 GB2312,比如你在 Linux 上拿 Python 解析国内声明为 GB2312 的网页时一遇到生僻字或者繁体字就会报错了。
该系统采用先进的HTML5+CSS3结构,既有手机APP的良好体验,又有智能建站系统的操作方便。在中国,企业网站建设在已有20年,但表现方式基本是一成不变,此产品进行了与众不同的偿试。一切以小微企业实际情况出发,注重核心产品的塑造以及企业文化展示。让小微企业及个人都能找准自身的细分化定位,服务好客户。
0
>>> print -l 简体中文 繁體中文| iconv -f utf-8 -t gb2312 � ��iconv: 未知 16 处的非法输入序列 >>> print -l 简体中文 繁體中文| iconv -f utf-8 -t gbk � ��
前一命令在「體」字上转码出错了,后一命令成功执行。
GB 2312字符集并未包括繁体字,只有少数几个特例,这在维基百科GB 2312上有提到,所以如果严格按照GB 2312编码存储,会造成字符数据丢失。但是在Windows平台上当Locale是中国大陆时用非Unicode字符集进行汉字编码,默认会采用的是兼容GB 2312的GBK或GB 18030编码,这两个字符集都包含繁体字。
摘自 Wiki GB 2312
GB 2312 或 GB 2312-80 是中华人民共和国国家标准 简体中文字符集
不能。繁体应当是Big5.
你到浏览器里面看看,当前是什么字符集。
GB2312 GB2312
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号