0

0

c++怎么进行字符串的URL编码与解码_c++ 特殊字符转义处理逻辑【实战】

尼克

尼克

发布时间:2026-01-08 12:08:50

|

550人浏览过

|

来源于php中文网

原创

最稳妥的URL编解码需手动查表:编码保留A-Z、a-z、0-9及-_.~,空格转%20,中文等先转UTF-8再编码;解码须严格校验%XX格式,大小写不敏感,不自动转码。

c++怎么进行字符串的url编码与解码_c++ 特殊字符转义处理逻辑【实战】

URL 编码:用 std::ostringstream + 手动查表最稳妥

标准 C++ 没有内置 URL 编码函数,std::urlencode 不存在,别被某些文档误导。最可靠的方式是遍历字符串,对非字母数字及 -_.~ 字符做百分号编码。

注意:RFC 3986 明确规定只保留 A-Z a-z 0-9 - _ . ~ 不编码,空格必须转为 %20(不是 +),这点和 application/x-www-form-urlencoded 不同。

  • 不要用 std::hex 直接输出小写十六进制——需补前导零并强制大写(如 ' ' → "%20",不是 "%2")
  • 中文、emoji 等需先转 UTF-8 字节序列再编码,不能直接 cast char ——否则多字节字符会乱码
  • 常见错误:把 '/'':' 漏掉编码,导致生成的 URL 被解析器截断
std::string url_encode(const std::string& s) {
    std::ostringstream ret;
    for (unsigned char c : s) {
        if (std::isalnum(c) || c == '-' || c == '_' || c == '.' || c == '~') {
            ret << c;
        } else {
            ret << '%' << std::uppercase << std::hex << std::setw(2) << std::setfill('0') << (int)c;
        }
    }
    return ret.str();
}

URL 解码:逐字节解析 %XX,拒绝无效序列

解码比编码更易出错。核心是识别 % 后跟两个十六进制字符,且必须严格校验——%G1%1%123 都应原样保留或报错,不能静默忽略。

UTF-8 安全解码的关键:解码后得到的是 raw bytes,**不自动转码**;若原始是 UTF-8 字符串,解码结果自然仍是合法 UTF-8,无需额外转换。

立即学习C++免费学习笔记(深入)”;

DeepAI
DeepAI

为天生具有创造力的人提供的AI工具

下载
  • 遇到孤立 % 或不完整十六进制(如 %A),跳过 % 并保留后续字符,避免崩溃
  • 不建议用 std::stoi(..., nullptr, 16)——它会截断非十六进制字符,导致 %ZZ 变成 0
  • 大小写不敏感:%aF%AF 都应解为 0xAF
std::string url_decode(const std::string& s) {
    std::string ret;
    ret.reserve(s.size());
    for (size_t i = 0; i < s.size(); ++i) {
        if (s[i] == '%' && i + 2 < s.size()) {
            int hex_val;
            if (std::isxdigit(s[i+1]) && std::isxdigit(s[i+2]) &&
                sscanf(s.c_str() + i + 1, "%2x", &hex_val) == 1) {
                ret += static_cast(hex_val);
                i += 2;
                continue;
            }
        }
        ret += s[i];
    }
    return ret;
}

处理中文和 emoji:必须先 UTF-8 编码再 URL 编码

C++ std::string 本身不区分编码,但 URL 编码操作对象必须是 UTF-8 字节流。如果你拿到的是 std::u8string(C++20)或 std::wstring(Windows 宽字符),得先转 UTF-8。

  • Linux/macOS 下,std::string 通常就是 UTF-8,可直接传入 url_encode()
  • Windows 控制台默认是 GBK,读取中文文件或用户输入时,需用 std::wstring_convert<:codecvt_utf8>>(C++17 前)或 std::from_bytes(C++23)转 UTF-8
  • 别对已编码的字符串重复编码——比如 url_encode(url_encode("你好")) 会产生 %25E4%25BD%25A0(% 被二次编码)

性能与边界:短字符串用,长 URL 避免反复 push_back

URL 编/解码本质是 O(n) 内存拷贝,但高频调用时,std::ostringstream 构造/析构开销明显。对确定长度的短字符串(如 token 参数),可预分配 std::string 并用 reserve() 减少重分配。

  • 编码后长度最多是原长 3 倍(如所有字符都编码),解码后 ≤ 原长,预留空间能避免多次内存重分配
  • 生产环境若每秒处理万级 URL,建议用无锁静态查表 + SIMD 加速(如 Intel ISA-L),但绝大多数场景没必要
  • 永远检查输入是否为空或含嵌入 null 字节('\0')——std::string 支持 null,但某些 C 接口会截断

实际最难的不是写对逻辑,是搞清你手上的字符串到底是什么编码、从哪来、要交给谁用。URL 编码只是字节搬运工,它不管语义。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

315

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

231

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

435

2024.03.01

登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6070

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

794

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1054

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1180

2024.03.01

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

253

2023.08.03

java学习网站推荐汇总
java学习网站推荐汇总

本专题整合了java学习网站相关内容,阅读专题下面的文章了解更多详细内容。

6

2026.01.08

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 6.8万人学习

Git 教程
Git 教程

共21课时 | 2.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号