0

0

c++中如何实现字符串的URL编码_c++对特殊字符进行转义的方法【汇总】

尼克

尼克

发布时间:2026-01-27 11:31:02

|

624人浏览过

|

来源于php中文网

原创

必须编码的字符是除A-Z、a-z、0-9及-_.~以外的所有字符;空格须编码为%20,UTF-8字节流按字节处理,不可用std::isalnum或重复编码,推荐使用Boost.URL等成熟库。

c++中如何实现字符串的url编码_c++对特殊字符进行转义的方法【汇总】

URL 编码(Percent-encoding)在 C++ 中没有标准库函数直接支持,必须手动实现或借助第三方库;标准 std::string 不提供 encodeURIComponent 类能力,所有非字母数字字符(除 -_.~ 外)都需转为 %XX 形式。

哪些字符必须被编码?

根据 RFC 3986,URL 中仅以下字符被视为“未保留”(unreserved),可不编码:

  • 大写/小写字母:A-Za-z
  • 数字:0-9
  • 特殊符号:-_.~

其余所有字符(包括空格、中文、/?=&#、控制字符等)都应被编码。注意: (空格)必须转为 %20,不是 + —— 后者是 application/x-www-form-urlencoded 的规则,不适用于通用 URL 编码。

手写 URL 编码函数(C++11+)

核心逻辑:遍历每个字节,判断是否属于 unreserved 字符;若否,则用 % + 两位十六进制大写表示该字节值。注意:此实现针对 UTF-8 编码的字符串(现代 C++ 项目默认假设),不做 Unicode 码点拆分,直接按字节处理。

立即学习C++免费学习笔记(深入)”;

std::string url_encode(const std::string& s) {
    std::string result;
    result.reserve(s.size() * 3); // 最坏情况:每个字节变成 %XX
    for (unsigned char c : s) {
        if ((c >= 'A' && c <= 'Z') ||
            (c >= 'a' && c <= 'z') ||
            (c >= '0' && c <= '9') ||
            c == '-' || c == '_' || c == '.' || c == '~') {
            result += c;
        } else {
            result += '%';
            result += "0123456789ABCDEF"[c >> 4];
            result += "0123456789ABCDEF"[c & 15];
        }
    }
    return result;
}

使用示例:

阿里妈妈·创意中心
阿里妈妈·创意中心

阿里妈妈营销创意中心

下载
std::string raw = "hello 世界?key=value&sub=path/to";
std::string encoded = url_encode(raw); // → "hello%20%E4%B8%96%E7%95%8C?key=value&sub=path/to"

⚠️ 注意:%E4%B8%96%E7%95%8C 是 UTF-8 字节序列的编码结果,不是 UTF-16 或其他编码。若输入不是合法 UTF-8(如 GBK 字符串混入),结果将错误且不可逆。

常见错误与兼容性陷阱

实际项目中容易踩的坑:

  • std::isalnum(c) 不能直接用:它依赖当前 locale,可能把非 ASCII 字母(如 é、α)判为 alnum,导致漏编码
  • 误用 std::hex + std::stringstream:易引入前导空格、大小写混乱、性能差,且难以控制两位固定宽度
  • 对已编码字符串重复编码:例如 %20 再次编码成 %2520,造成双编码污染
  • 混淆 URL 编码与 form 表单编码:后者把空格转 +,且不编码 *' 等字符;二者不可互换
  • 忽略路径分隔符语义:如 / 在路径段中通常不编码(它是分隔符),但在查询参数值中必须编码(如 ?q=a/b 应为 ?q=a%2Fb

更安全的替代方案:用成熟库

若项目允许引入依赖,推荐:

  • cpp-httplib:轻量,含 detail::encode_url(内部函数,需复制或封装)
  • Boost.URL(v1.83+):提供 boost::urls::encode,支持按 component(scheme、path、query 等)精细编码,自动处理 UTF-8 边界
  • cprlibcurl:其 C 接口有 curl_easy_escape,但已标记为 deprecated;新代码应避免

Boost 示例(需链接 boost_url):

boost::urls::result u = boost::urls::parse_uri("https://ex.com/q?k=v w");
auto encoded = boost::urls::encode(u.value().params().begin()->value, boost::urls::pct_encode_opts{}); // → "v%20w"

真正难的不是写一个能跑的编码函数,而是确保它在所有边界场景下——比如混合中日韩文字、emoji、NUL 字节、代理对(surrogate pairs)缺失、locale 切换时——行为一致且符合 RFC。多数业务代码其实只需要对 query 参数值做编码,此时明确限定输入范围 + 单字节处理,比追求“全 Unicode 支持”更可靠。

相关文章

c++速学教程(入门到精通)
c++速学教程(入门到精通)

c++怎么学习?c++怎么入门?c++在哪学?c++怎么学才快?不用担心,这里为大家提供了c++速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c++和c语言的区别有哪些
c++和c语言的区别有哪些

c++和c语言的区别:1、面向对象编程(OOP)支持不同;2、新增特性不同;3、标准库不同;4、编译方式不同;5、命名空间不同等等。想了解更多c++的相关内容,可以阅读本专题下面的文章。

258

2024.03.14

c++和python学习顺序推荐
c++和python学习顺序推荐

一般建议先学习C++,再学习Python,因为这样可以逐步从较为底层的编程语言向更高级的语言过渡。想了解更多python的相关内容,可以阅读本专题下面的文章。

423

2024.03.14

python和c++学习性价比分析
python和c++学习性价比分析

Python易于学习,广泛应用于Web开发、数据科学和人工智能等领域,但性能较低。C语言性能高,适用于对性能要求较高的场景,如游戏开发和系统编程,但学习曲线陡峭,错误处理复杂。想了解更多python的相关内容,可以阅读本专题下面的文章。

103

2024.03.14

c语言和c++一样吗
c语言和c++一样吗

c语言和c++是两种不同的编程语言,虽然有相似之处,但存在显著差异。c语言专注于过程式编程和系统级开发,以简洁、高效著称。c++作为c语言的超集,引入了面向对象编程,增强了代码组织和管理能力,但学习曲线也更陡峭。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

135

2024.03.14

c语言和c++先学哪个好
c语言和c++先学哪个好

初学者选择学习c语言还是c++语言,需要根据个人学习目标、背景以及编程兴趣和预期应用方向来决定。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

101

2024.03.14

c语言和c++的区别和联系
c语言和c++的区别和联系

c语言和c++是计算机科学领域应用广泛的编程语言。虽然它们有着相似的基础,但它们在语言类型、语法功能和内存管理方面存在着显著差异。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

123

2024.03.14

c++软件中文更改教程
c++软件中文更改教程

对于 ide,可通过打开设置,找到语言设置,选择中文,并保存更改。对于非 ide 应用程序,可查找设置或选项,选择语言设置,更改为中文,并保存更改。想了解更多c++的相关内容,可以阅读本专题下面的文章。

303

2024.03.21

python和java和c++学习性价比分析
python和java和c++学习性价比分析

Python以其易学性、丰富的库和活跃的社区而著称,适合数据科学、人工智能和Web开发。Java以其跨平台性、企业级应用开发和Android应用开发而闻名。C++以其底层控制能力、高效性能和游戏开发而著称。选择哪种语言取决于个人兴趣、职业方向和特定需求。想了解更多python和java和c++的相关内容,可以阅读本专题下面的文章。

335

2024.03.22

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

1

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Rust 教程
Rust 教程

共28课时 | 4.9万人学习

Git 教程
Git 教程

共21课时 | 3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号