0

0

c++中如何进行UTF-8和GBK编码转换_C++字符编码转换方案

尼克

尼克

发布时间:2025-09-19 12:46:01

|

973人浏览过

|

来源于php中文网

原创

使用Windows API或iconv库实现C++中UTF-8与GBK互转,Windows通过WideCharToMultiByte等函数以UTF-16为中介转换,Linux下用iconv库处理,跨平台可选ICU或封装统一接口。

c++中如何进行utf-8和gbk编码转换_c++字符编码转换方案

在C++中处理中文字符时,经常会遇到UTF-8和GBK编码之间的转换需求,尤其是在跨平台开发或与Windows系统交互时。由于C++标准库本身不直接支持多字节编码转换,我们需要借助第三方库或系统API来实现。

使用Windows API进行UTF-8与GBK转换

在Windows平台上,可以使用MultiByteToWideCharWideCharToMultiByte函数完成编码转换,通过UTF-16作为中间编码进行中转。

UTF-8 转 GBK 示例:

#include 
#include 

std::string utf8_to_gbk(const std::string& utf8) { int len = MultiByteToWideChar(CP_UTF8, 0, utf8.c_str(), -1, nullptr, 0); if (len == 0) return "";

std::wstring wide(len, 0);
MultiByteToWideChar(CP_UTF8, 0, utf8.c_str(), -1, &wide[0], len);

len = WideCharToMultiByte(936, 0, wide.c_str(), -1, nullptr, 0, nullptr, nullptr);
if (len == 0) return "";

std::string gbk(len - 1, 0);
WideCharToMultiByte(936, 0, wide.c_str(), -1, &gbk[0], len, nullptr, nullptr);

return gbk;

}

立即学习C++免费学习笔记(深入)”;

GBK 转 UTF-8 示例:

std::string gbk_to_utf8(const std::string& gbk) {
    int len = MultiByteToWideChar(936, 0, gbk.c_str(), -1, nullptr, 0);
    if (len == 0) return "";
std::wstring wide(len, 0);
MultiByteToWideChar(936, 0, gbk.c_str(), -1, &wide[0], len);

len = WideCharToMultiByte(CP_UTF8, 0, wide.c_str(), -1, nullptr, 0, nullptr, nullptr);
if (len == 0) return "";

std::string utf8(len - 1, 0);
WideCharToMultiByte(CP_UTF8, 0, wide.c_str(), -1, &utf8[0], len, nullptr, nullptr);

return utf8;

}

立即学习C++免费学习笔记(深入)”;

使用iconv库(Linux/跨平台)

在Linux或macOS系统中,推荐使用iconv库进行编码转换,它支持多种编码格式且跨平台兼容性好。

安装 iconv(如未自带):

# Ubuntu/Debian
sudo apt-get install libiconv-dev

macOS (使用Homebrew)

brew install libiconv

喜鹊标书
喜鹊标书

AI智能标书制作平台,10分钟智能生成20万字投标方案,大幅提升中标率!

下载

使用 iconv 进行转换:

#include 
#include 

std::string code_convert(const std::string& in, const char from, const char to) { iconv_t cd = iconv_open(to, from); if (cd == (iconv_t)-1) return "";

size_t in_len = in.length();
size_t out_len = in_len * 4;
std::string out(out_len, 0);

char* in_buf = const_castzuojiankuohaophpcnchar*youjiankuohaophpcn(in.c_str());
char* out_buf = &out[0];

size_t ret = iconv(cd, &in_buf, &in_len, &out_buf, &out_len);
iconv_close(cd);

if (ret == (size_t)-1) return "";
out.resize(out.length() - out_len);
return out;

}

立即学习C++免费学习笔记(深入)”;

// 使用示例 std::string utf8_to_gbk(const std::string& utf8) { return code_convert(utf8, "UTF-8", "GBK"); }

std::string gbk_to_utf8(const std::string& gbk) { return code_convert(gbk, "GBK", "UTF-8"); }

使用第三方库:UTF8-CPP 或 ICU

如果需要更轻量或更强大的支持,可以选择:

  • UTF8-CPP:轻量级头文件库,适合仅处理UTF-8验证和遍历,但不支持GBK转换。
  • ICU (International Components for Unicode):功能完整,支持各种编码、本地化和Unicode操作,适合大型项目。

ICU 示例片段:

#include 

std::string ucnv_convert(const char from_encoding, const char to_encoding, const std::string& input) { UErrorCode err = U_ZERO_ERROR; UConverter from = ucnv_open(from_encoding, &err); UConverter to = ucnv_open(to_encoding, &err);

int32_t target_len = ucnv_toAlgorithmic(UCNV_UTF8, to, nullptr, 0,
    ucnv_getUnicodeSet(from, nullptr, &err), input.c_str(), input.length(), &err);
// 实际转换略,需分配缓冲区并调用 ucnv_convertEx
// 此处简化说明,具体参考 ICU 文档
ucnv_close(from); ucnv_close(to);
return ""; // 省略完整实现

}

立即学习C++免费学习笔记(深入)”;

编译时需链接:

-licuuc -licudata

注意事项

  • Windows代码页936对应GBK,部分字符可能不完全覆盖GB18030。
  • 转换失败时检查输入数据是否合法,避免乱码传入。
  • 涉及内存操作时注意缓冲区大小,建议预留足够空间(如UTF-8最多4字节/字符)。
  • 跨平台项目建议封装一层转换接口,统一调用。

基本上就这些。根据你的运行环境选择合适的方法,Windows用API,Linux用iconv,复杂需求上ICU。不复杂但容易忽略细节。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

318

2023.08.02

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

524

2023.09.20

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1023

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

66

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

437

2025.12.29

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

578

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1104

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

792

2023.08.01

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

72

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.4万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号