如何在C++中拼接两个字符串_C++字符串拼接高效方法

下次还敢

发布时间：2025-09-24 13:22:01

942人浏览过

来源于php中文网

原创

拼接C++字符串时，优先使用std::string的append配合reserve预分配内存以提升性能；对于多类型数据拼接，推荐std::stringstream或C++20的std::format；避免使用+运算符进行大量拼接，因其产生临时对象导致效率低下；处理C风格字符串时应使用snprintf防止缓冲区溢出；std::string_view可用于高效传递字符串片段视图，减少拷贝开销。

如何在c++中拼接两个字符串_c++字符串拼接高效方法

在C++中拼接字符串，我们通常会用到std::string的+运算符、append方法，或者对于更复杂、性能敏感的场景，std::stringstream和C风格的strcat/sprintf也是选项。但要追求效率和安全性，选择合适的工具至关重要。

解决方案

拼接C++字符串，最常见的做法莫过于使用std::string。它提供了直观且类型安全的多种方式。

使用+运算符：这是最符合直觉的方式，就像数学加法一样。你可以将两个std::string对象拼接起来，也可以将std::string与C风格的字符串字面量（const char*）或单个字符拼接。

#include 
#include 

std::string s1 = "Hello";
std::string s2 = " World";
std::string s3 = s1 + s2; // "Hello World"
std::string s4 = s3 + "!"; // "Hello World!"
std::string s5 = "Prefix " + s4; // "Prefix Hello World!"
char c = '!';
std::string s6 = s1 + c; // "Hello!"

// 链式拼接
std::string s7 = "First" + std::string("Second") + "Third"; // 确保至少有一个是std::string对象
// 注意：不能直接 "First" + "Second"，因为这会尝试对两个const char*进行指针加法，编译会报错或行为未定义。
// 必须确保加号两侧至少有一个是std::string类型。

使用std::string::append()方法： append()是std::string的成员函数，它提供了更多元的拼接选项，例如拼接另一个字符串、字符串的一部分、重复的字符等。

#include 
#include 

std::string base = "My ";
std::string part1 = "name ";
std::string part2 = "is ";
std::string part3 = "Alice.";

base.append(part1); // "My name "
base.append(part2); // "My name is "
base.append(part3); // "My name is Alice."

// 拼接C风格字符串
base.append(" How are you?"); // "My name is Alice. How are you?"

// 拼接字符串的一部分 (从某个索引开始，拼接N个字符)
std::string full_sentence = "This is a long sentence.";
std::string sub_part;
sub_part.append(full_sentence, 8, 4); // 从索引8开始，拼接4个字符 ("long")

// 拼接重复的字符
std::string stars;
stars.append(5, '*'); // "*****"

使用std::stringstream：当需要拼接多个不同类型的数据（如字符串、整数、浮点数等）时，std::stringstream提供了一种类似cout的流式操作方式，非常方便。它在内部处理了类型转换和内存管理。

#include 
#include 
#include  // 引入stringstream头文件

int age = 30;
double height = 1.75;
std::string name = "Bob";

std::stringstream ss;
ss << "Name: " << name << ", Age: " << age << ", Height: " << height << "m.";

std::string result = ss.str(); // 获取拼接后的字符串
// result 现在是 "Name: Bob, Age: 30, Height: 1.75m."

C++中不同字符串拼接方式的性能差异有多大？或者，拼接大量字符串时，哪种方法更胜一筹？

在我看来，这是一个非常值得深思的问题，因为它直接关系到程序的运行效率，尤其是在处理大量文本数据时。不同的拼接方式，其底层实现和内存管理策略有着显著区别，这也就导致了性能上的巨大差异。

std::string的+运算符，虽然用起来最方便，但它在每次拼接时都可能创建一个新的临时std::string对象。举个例子，当你写s1 + s2 + s3时，编译器可能会先计算s1 + s2生成一个临时字符串，然后再用这个临时字符串去和s3拼接，再次生成一个新的字符串。这涉及多次内存分配、拷贝和释放，开销相当大。对于少量拼接，这点开销可以忽略不计，但如果在一个循环里拼接成百上千次，性能瓶颈就会非常明显。

立即学习“C++免费学习笔记（深入）”；

std::string::append()方法通常会比+运算符更高效一些。因为append是在原字符串的内存空间上进行操作，如果原字符串的容量足够，它就直接在现有空间后追加内容，避免了创建临时对象和不必要的内存重新分配。当容量不足时，std::string会重新分配一块更大的内存，然后将旧内容和新内容都拷贝过去。虽然也会有重新分配和拷贝的开销，但通常比+运算符的多次临时对象创建要少。如果你知道最终字符串的大致长度，可以提前使用std::string::reserve()方法预分配内存，这样能最大程度地减少重新分配的次数，进一步提升append的效率。

而std::stringstream，它的内部机制有点像一个动态增长的缓冲区。当你向它插入数据时，它会智能地管理内存。对于拼接大量不同类型的数据，或者需要多次追加内容而又不知道最终长度的场景，stringstream无疑是一个非常优雅且性能不错的选择。它避免了+运算符的临时对象问题，也比手动管理C风格字符串要安全得多。然而，它也有自己的开销，比如流对象的创建和销毁，以及内部缓冲区的管理。在纯粹拼接std::string的场景下，如果能精确预分配内存，append可能会略胜一筹。

至于C风格字符串（char*）的拼接，比如strcat或sprintf，它们理论上可以做到非常高的效率，因为它们直接操作原始内存。但这种效率是以牺牲安全性为代价的，极易导致缓冲区溢出，我个人非常不推荐在现代C++代码中直接使用它们进行字符串拼接，除非你对内存管理有绝对的把握，并且有非常严格的性能要求。后面我会专门聊聊这方面的问题。

总结一下，拼接大量字符串时：

飞笔AI

飞笔AI致力于创作高质量的海报等图像，满足用户个性化设计需求。用户可通过平台便捷地创建各种风格和主题的海报、新媒体素材图等。

下载

首选：如果你知道最终字符串的大致长度，使用std::string配合reserve()和append()。这是我个人认为在安全性和效率之间取得最佳平衡的方法。
次之：如果你需要拼接多种类型的数据，或者拼接次数多但无法预知总长度，std::stringstream是一个非常好的选择，它在便利性和性能上都表现不俗。
避免：std::string的+运算符在大量拼接时效率最低，应尽量避免。C风格字符串函数除非迫不得已，否则不建议使用。

// 示例：大量字符串拼接的性能考量
#include 
#include 
#include 
#include 
#include  // 用于计时

void test_plus_operator(const std::vector& parts) {
    std::string result;
    for (const auto& p : parts) {
        result = result + p; // 每次可能创建临时对象
    }
    // std::cout << "Plus operator result size: " << result.size() << std::endl;
}

void test_append_method(const std::vector& parts) {
    std::string result;
    // 估算总长度并reserve
    size_t total_len = 0;
    for (const auto& p : parts) {
        total_len += p.length();
    }
    result.reserve(total_len); // 预分配内存

    for (const auto& p : parts) {
        result.append(p); // 在现有空间上追加
    }
    // std::cout << "Append method result size: " << result.size() << std::endl;
}

void test_stringstream(const std::vector& parts) {
    std::stringstream ss;
    for (const auto& p : parts) {
        ss << p;
    }
    std::string result = ss.str(); // 最后一次性获取
    // std::cout << "Stringstream result size: " << result.size() << std::endl;
}

int main() {
    std::vector test_parts;
    for (int i = 0; i < 1000; ++i) { // 拼接1000次
        test_parts.push_back("Part" + std::to_string(i) + "_");
    }

    auto start = std::chrono::high_resolution_clock::now();
    test_plus_operator(test_parts);
    auto end = std::chrono::high_resolution_clock::now();
    std::chrono::duration diff = end - start;
    std::cout << "Plus operator took: " << diff.count() << " s" << std::endl;

    start = std::chrono::high_resolution_clock::now();
    test_append_method(test_parts);
    end = std::chrono::high_resolution_clock::now();
    diff = end - start;
    std::cout << "Append method (with reserve) took: " << diff.count() << " s" << std::endl;

    start = std::chrono::high_resolution_clock::now();
    test_stringstream(test_parts);
    end = std::chrono::high_resolution_clock::now();
    diff = end - start;
    std::cout << "Stringstream took: " << diff.count() << " s" << std::endl;

    return 0;
}

运行这段代码，你会非常直观地看到append和stringstream在处理大量拼接时的巨大优势，而+运算符则会慢上好几倍甚至几十倍。

处理C风格字符串拼接时有哪些常见的“坑”？如何避免内存泄漏和缓冲区溢出？

C风格字符串（char*）的拼接，在我看来，就像是在走钢丝，稍有不慎就可能万劫不复。它最大的“坑”就是内存管理。不像std::string那样有自动的内存伸缩和管理，C风格字符串需要我们手动分配内存，并且要确保分配的内存足够大，否则就会发生臭名昭著的缓冲区溢出（Buffer Overflow）。

常见的C风格字符串拼接函数有strcat和strncat。

strcat(dest, src)：它会将src字符串的内容追加到dest字符串的末尾。问题在于，strcat不会检查dest是否有足够的空间。如果dest的缓冲区不够大，它就会越界写入，覆盖掉相邻的内存区域，这会导致程序崩溃、数据损坏，甚至可能被恶意利用。
strncat(dest, src, n)：这是一个稍微安全一点的版本，它会最多从src中拷贝n个字符到dest，并且保证dest以空字符\0结尾。但即便如此，你依然需要确保dest的缓冲区在追加n个字符后，加上原有的内容和末尾的\0，总长度不超过其分配的大小。如果n设置得太大，或者dest的原始大小估计不足，仍然可能发生溢出。

我个人在工作中，几乎完全避免直接使用strcat这类函数。如果非要处理C风格字符串，我更倾向于使用snprintf函数。

snprintf(buffer, buffer_size, format, ...)：这个函数来自C标准库，它是一个格式化输出函数，可以将各种类型的数据格式化并写入到一个指定的缓冲区中。关键在于它的第二个参数buffer_size，它明确告诉snprintf这个缓冲区有多大，snprintf会保证写入的字符数量（包括末尾的空字符\0）不会超过buffer_size。这极大地提高了安全性，有效避免了缓冲区溢出。

#include  // 用于snprintf
#include  // 用于strlen
#include 

void c_style_concat_danger() {
    char buffer[10]; // 只能容纳9个字符 + '\0'
    strcpy(buffer, "Hello"); // "Hello\0"
    // strcat(buffer, " World"); // 危险！"Hello World"需要11个字符，会溢出
    // std::cout << "Potentially crashed or corrupted: " << buffer << std::endl;
}

void c_style_concat_safe() {
    char buffer[20]; // 分配足够大的空间
    strcpy(buffer, "Hello"); // buffer现在是 "Hello\0"
    size_t current_len = strlen(buffer);

    // 使用snprintf安全拼接
    // 参数1: 目标缓冲区
    // 参数2: 缓冲区最大容量 (包括'\0')
    // 参数3: 格式字符串
    // 参数4+: 要格式化的数据
    snprintf(buffer + current_len, sizeof(buffer) - current_len, " World! %d", 123);
    // buffer + current_len: 从当前字符串的末尾开始写入
    // sizeof(buffer) - current_len: 剩余可用空间
    std::cout << "Safe C-style concat: " << buffer << std::endl; // "Hello World! 123"
}

int main() {
    // c_style_concat_danger(); // 运行这行代码可能会导致程序崩溃或未定义行为
    c_style_concat_safe();
    return 0;
}

关于内存泄漏，C风格字符串拼接本身不会直接导致内存泄漏，但如果你手动malloc了一块内存来存储拼接结果，却忘记free掉它，那就会发生内存泄漏。std::string的出现，就是为了解决这些手动内存管理带来的复杂性和风险。所以我强烈建议，除非有非常特殊且不可替代的理由，否则请优先选择std::string。

在现代C++开发中，拼接字符串有哪些推荐的最佳实践？什么场景下应该选择`std::string_view`或自定义拼接函数？

在现代C++开发中，我们有更多、更安全、更高效的工具来处理字符串拼接。我的建议是，始终把安全性和可维护性放在第一位，在此基础上再考虑性能优化。

优先使用std::string及其成员函数：这是最基本也是最推荐的做法。对于大多数日常拼接需求，+运算符和append()方法已经足够。当拼接操作较多时，如前所述，使用std::string::reserve()预分配内存是一个非常有效的优化手段。
利用std::stringstream处理复杂类型拼接：当需要将数字、布尔值、自定义对象（只要它们支持operator）等多种类型的数据组合成一个字符串时，std::stringstream是最佳选择。它提供了类型安全且简洁的语法，避免了手动类型转换的麻烦。
拥抱C++20的std::format：如果你的项目支持C++20，那么std::format（或者其前身fmtlib）绝对是字符串格式化和拼接的“神器”。它结合了stringstream的类型安全和printf的格式化能力，同时提供了卓越的性能。它通过预解析格式字符串，在编译期就能发现许多错误，并且在运行时避免了stringstream的一些开销。
```
#include 
#include 
#include  // C++20标准库

int value = 42;
double pi = 3.14159;
std::string name = "World";

std::string formatted_str = std::format("Hello, {}! The answer is {}, PI is {:.2f}.", name, value, pi);
std::cout << formatted_str << std::endl;
// 输出: Hello, World! The answer is 42, PI is 3.14.
```
在我看来，std::format几乎完美地解决了字符串拼接和格式化的痛点，它应该是未来C++字符串处理的首选。
何时考虑std::string_view？std::string_view（C++17引入）本身不是用来拼接字符串的，它的作用是提供一个对现有字符串（无论是std::string还是C风格字符串）的“视图”，而不会拥有或复制底层数据。这意味着它非常轻量级，传递和操作string_view比传递std::string更高效，因为它避免了不必要的内存分配和拷贝。那么，它和拼接有什么关系呢？在某些场景下，你可能需要拼接字符串的一部分，或者只是想查看拼接结果的某个片段。string_view可以帮助你在这些中间步骤中避免创建临时的std::string对象。例如，如果你有一个函数接受多个字符串片段，并最终将它们拼接，那么在函数内部处理这些片段时，使用string_view作为参数类型，可以减少参数传递时的开销。但请记住，最终的拼接结果通常仍需要存储在一个std::string中。
```
#include 
#include  // C++17
#include 

// 假设这个函数处理字符串片段，最终可能用于拼接
void process_parts(std::string_view p1, std::string_view p2) {
    // 在这里，p1和p2只是视图，没有发生拷贝
    std::cout << "Processing: " << p1 << " and " << p2 << std::endl;
    // 如果需要拼接，可以这样做
```