首页 > 后端开发 > C++ > 正文

如何用C++编写单词统计程序 字符串处理和map容器使用

P粉602998670
发布: 2025-06-29 11:53:02
原创
465人浏览过

要编写一个单词统计程序,核心步骤包括:1.使用std::istringstream和std::isalpha分割并清洗字符串中的单词;2.通过std::map统计词频;3.遍历map输出结果或按频率排序。具体实现中,先定义cleanword函数过滤非字母字符并统一转小写,再利用map存储单词及出现次数,最后可选择直接输出或复制到vector后排序处理。整个过程需注意分隔符处理、大小写统一及map操作方式。

如何用C++编写单词统计程序 字符串处理和map容器使用

写一个单词统计程序,核心在于字符串处理和用 map 统计词频。C++ 提供了丰富的字符串操作函数和标准容器,只要合理使用就能实现这个功能。

如何用C++编写单词统计程序 字符串处理和map容器使用

1. 分割字符串中的单词

要统计单词数量,第一步是把输入的字符串按空格、标点等分隔符拆分成一个个单词。常用的函数是 std::istringstream 和 std::isalpha 配合处理。

如何用C++编写单词统计程序 字符串处理和map容器使用
#include <sstream>
#include <cctype>

std::string cleanWord(const std::string& word) {
    std::string cleaned;
    for (char c : word) {
        if (std::isalpha(c)) {
            cleaned += std::tolower(c); // 统一转小写
        }
    }
    return cleaned;
}
登录后复制

这段代码会过滤掉非字母字符,并将所有字母统一为小写,避免 "Hello" 和 "hello" 被当作不同单词。

立即学习C++免费学习笔记(深入)”;


2. 使用 map 容器统计词频

C++ 中的 std::map 是一种键值对结构,非常适合用来统计每个单词出现的次数。

如何用C++编写单词统计程序 字符串处理和map容器使用

主流程大概是这样的:

  • 读取一段文本(可以从文件或控制台输入)
  • 拆分成单词
  • 对每个单词进行清洗
  • 在 map 中查找是否存在该单词:
    • 如果存在,对应的计数加一
    • 如果不存在,插入新键并设置初始计数为 1

示例代码片段如下:

#include <map>
#include <string>

std::map<std::string, int> wordCount;

std::string word;
while (iss >> word) {
    std::string cleaned = cleanWord(word);
    if (!cleaned.empty()) {
        wordCount[cleaned]++;
    }
}
登录后复制

这里用 std::istringstream 来逐个读取单词,再通过前面定义的 cleanWord 做预处理。


3. 输出结果或进一步处理

遍历 map 的内容很简单,直接用一个循环就可以打印出所有单词及其出现次数:

for (const auto& pair : wordCount) {
    std::cout << pair.first << ": " << pair.second << std::endl;
}
登录后复制

如果想按频率排序,可以先把 map 的内容复制到 vector,然后自定义排序规则:

#include <vector>
#include <algorithm>

std::vector<std::pair<std::string, int>> items(wordCount.begin(), wordCount.end());

std::sort(items.begin(), items.end(),
          [](const std::pair<std::string, int>& a, const std::pair<std::string, int>& b) {
              return b.second < a.second; // 降序排列
          });

for (const auto& item : items) {
    std::cout << item.first << ": " << item.second << std::endl;
}
登录后复制

这样就能输出按频率从高到低排好序的结果了。


基本上就这些。整个过程不算复杂,但有几个细节容易忽略,比如标点处理、大小写统一、以及 map 插入方式。把这些地方注意好,程序就能稳定运行了。

以上就是如何用C++编写单词统计程序 字符串处理和map容器使用的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号