答案:C++字符串去重常用方法包括unordered_set辅助去重、小写字母数组标记法及排序后unique处理,分别适用于通用场景、字符受限场景和无需保持顺序的场景。

在C++中实现字符串去重,指的是去除字符串中重复的字符,只保留每个字符第一次出现的位置。常见的需求是将类似 "aabbcc" 转换为 "abc"。下面介绍几种实用且高效的实现方法。
使用 std::unordered_set 辅助去重
利用哈希集合(std::unordered_set)记录已出现的字符,遍历原字符串,只将未出现过的字符加入结果。
示例代码:#include
#include
#include
std::string removeDuplicates(const std::string& str) {
std::string result;
std::unordered_setseen;
for (char c : str) {
if (seen.find(c) == seen.end()) {
seen.insert(c);
result += c;
}
}
return result;
}
int main() {
std::string input = "hello world";
std::cout << removeDuplicates(input) << std::endl; // 输出: helo wrd
return 0;
}
该方法时间复杂度接近 O(n),适合大多数场景。
立即学习“C++免费学习笔记(深入)”;
仅适用于小写字母的数组标记法
如果字符串只包含 a-z 小写字母,可以用布尔数组代替哈希表,提高效率并减少开销。
示例代码:std::string removeDuplicatesOptimized(const std::string& str) {
std::string result;
bool seen[26] = {false}; // 假设只有小写字母
for (char c : str) {
if (islower(c) && !seen[c - 'a']) {
seen[c - 'a'] = true;
result += c;
}
}
return result;
}
此方法速度更快,但适用范围有限,需确保输入字符在预期范围内。
保持顺序 vs 不保持顺序
上述方法都保持字符首次出现的顺序。若不需要保持顺序,可直接使用 std::set 或 std::sort + std::unique。
例如使用排序后去重:
#include
std::string removeDuplicatesUnordered(std::string str) {
std::sort(str.begin(), str.end());
auto last = std::unique(str.begin(), str.end());
str.erase(last, str.end());
return str;
}
这种方法会改变原始顺序,结果为字典序,适用于不需要顺序的场景。
总结与建议
根据实际需求选择合适的方法:
- 通用情况推荐使用 std::unordered_set,简洁高效
- 字符范围受限时可用数组标记,性能更优
- 允许乱序时可结合 sort 和 unique
- 注意字符串是否包含大小写、空格或特殊字符,必要时做预处理
基本上就这些,不复杂但容易忽略细节,比如是否保留顺序、字符集范围等。











