0

0

如何实现C++中的字符串匹配算法?

尼克

尼克

发布时间:2025-05-30 17:21:01

|

927人浏览过

|

来源于php中文网

原创

c++++中的字符串匹配算法包括暴力匹配、kmp算法、boyer-moore算法和rabin-karp算法。1. 暴力匹配简单但效率低,适用于小规模数据。2. kmp算法通过部分匹配表提高效率,适用于大规模文本匹配。3. boyer-moore算法通过坏字符和好后缀规则提升匹配速度,适用于大文本和长模式串。4. rabin-karp算法利用哈希函数快速比较,适用于处理大量模式串。选择算法需考虑文本大小、模式串长度和性能需求。

如何实现C++中的字符串匹配算法?

提到C++中的字符串匹配算法,不得不说这是一个既基础又深奥的话题。让我们从回答这个问题开始,进而深入探讨实现细节和一些有趣的应用。

实现C++中的字符串匹配算法,最常见的方法包括但不限于暴力匹配、KMP算法、Boyer-Moore算法和Rabin-Karp算法。每个算法都有其独特的魅力和适用场景。让我分享一下我对这些算法的理解和在实际项目中的应用经验。

首先来看看暴力匹配,这是最直观、最容易实现的算法,尽管效率不高,但在小规模数据或简单需求中仍然有其用武之地。暴力匹配的核心思想就是逐个比较两个字符串的字符,直到找到匹配或确定不存在匹配为止。

立即学习C++免费学习笔记(深入)”;

#include 
#include 

bool bruteForceMatch(const std::string& text, const std::string& pattern) {
    int n = text.length();
    int m = pattern.length();

    for (int i = 0; i <= n - m; ++i) {
        int j;
        for (j = 0; j < m; ++j) {
            if (text[i + j] != pattern[j]) {
                break;
            }
        }
        if (j == m) {
            return true; // 匹配成功
        }
    }
    return false; // 匹配失败
}

int main() {
    std::string text = "Hello, World!";
    std::string pattern = "World";
    if (bruteForceMatch(text, pattern)) {
        std::cout << "Pattern found!" << std::endl;
    } else {
        std::cout << "Pattern not found!" << std::endl;
    }
    return 0;
}

暴力匹配虽然简单,但在大规模数据中表现不佳,因为其时间复杂度为O(n*m),其中n是文本长度,m是模式串长度。

在实际应用中,我更倾向于使用KMP算法,因为它在处理大量文本匹配时表现出色。KMP算法通过预处理模式串,构建一个部分匹配表(PMT),从而在匹配失败时能够快速跳转到下一个可能的匹配位置,大大减少了不必要的比较次数。

#include 
#include 
#include 

void computeLPS(const std::string& pattern, std::vector& lps) {
    int len = 0;
    lps[0] = 0;
    int i = 1;
    while (i < pattern.length()) {
        if (pattern[i] == pattern[len]) {
            len++;
            lps[i] = len;
            i++;
        } else {
            if (len != 0) {
                len = lps[len - 1];
            } else {
                lps[i] = 0;
                i++;
            }
        }
    }
}

bool KMPMatch(const std::string& text, const std::string& pattern) {
    int n = text.length();
    int m = pattern.length();

    std::vector lps(m, 0);
    computeLPS(pattern, lps);

    int i = 0, j = 0;
    while (i < n) {
        if (pattern[j] == text[i]) {
            i++;
            j++;
        }
        if (j == m) {
            return true; // 匹配成功
        } else if (i < n && pattern[j] != text[i]) {
            if (j != 0) {
                j = lps[j - 1];
            } else {
                i++;
            }
        }
    }
    return false; // 匹配失败
}

int main() {
    std::string text = "ABABDABACDABABCABAB";
    std::string pattern = "ABABCABAB";
    if (KMPMatch(text, pattern)) {
        std::cout << "Pattern found!" << std::endl;
    } else {
        std::cout << "Pattern not found!" << std::endl;
    }
    return 0;
}

KMP算法的时间复杂度为O(n+m),在处理大规模文本匹配时表现优异。然而,KMP算法的实现相对复杂,尤其是在构建部分匹配表时需要仔细处理细节。

MD5校验和计算小程序(C)
MD5校验和计算小程序(C)

C编写,实现字符串摘要、文件摘要两个功能。里面主要包含3个文件: Md5.cpp、Md5.h、Main.cpp。其中Md5.cpp是算法的代码,里的代码大多是从 rfc-1321 里copy过来的;Main.cpp是主程序。

下载

在实际项目中,我曾用KMP算法来实现一个文本编辑器的搜索功能,它能够在数百万字符的文档中快速找到匹配的模式串,极大地提升了用户体验。

此外,Boyer-Moore算法和Rabin-Karp算法也各有千秋。Boyer-Moore算法通过从右向左匹配和坏字符规则、好后缀规则,实现了更高的匹配效率;而Rabin-Karp算法则通过哈希函数来快速比较子串,适用于处理大量模式串的场景。

#include 
#include 
#include 

int badCharHeuristic(const std::string& str, int size, char* badchar) {
    for (int i = 0; i < 256; i++) {
        badchar[i] = -1;
    }
    for (int i = 0; i < size; i++) {
        badchar[(int) str[i]] = i;
    }
}

void searchBM(const std::string& text, const std::string& pattern) {
    int m = pattern.length();
    int n = text.length();

    char badchar[256];
    badCharHeuristic(pattern, m, badchar);

    int s = 0;
    while (s <= (n - m)) {
        int j = m - 1;

        while (j >= 0 && pattern[j] == text[s + j]) {
            j--;
        }

        if (j < 0) {
            std::cout << "Pattern occurs at shift = " << s << std::endl;
            s += (s + m < n) ? m - badchar[text[s + m]] : 1;
        } else {
            s += std::max(1, j - badchar[text[s + j]]);
        }
    }
}

int main() {
    std::string text = "ABAAABCD";
    std::string pattern = "ABC";
    searchBM(text, pattern);
    return 0;
}

Boyer-Moore算法在实际应用中表现出色,特别是在处理大文本和长模式串时。然而,它的实现较为复杂,容易出错,需要仔细调试。

Rabin-Karp算法则通过哈希函数来快速比较子串,适用于处理大量模式串的场景。以下是一个简单的Rabin-Karp算法实现:

#include 
#include 

bool RabinKarp(const std::string& text, const std::string& pattern) {
    int n = text.length();
    int m = pattern.length();
    const int d = 256; // 字符集大小
    const int q = 101; // 一个质数

    int h = 1;
    for (int i = 0; i < m - 1; i++) {
        h = (h * d) % q;
    }

    int p = 0, t = 0;
    for (int i = 0; i < m; i++) {
        p = (d * p + pattern[i]) % q;
        t = (d * t + text[i]) % q;
    }

    for (int i = 0; i <= n - m; i++) {
        if (p == t) {
            int j;
            for (j = 0; j < m; j++) {
                if (text[i + j] != pattern[j]) {
                    break;
                }
            }
            if (j == m) {
                return true; // 匹配成功
            }
        }
        if (i < n - m) {
            t = (d * (t - text[i] * h) + text[i + m]) % q;
            if (t < 0) {
                t = (t + q);
            }
        }
    }
    return false; // 匹配失败
}

int main() {
    std::string text = "ABABDABACDABABCABAB";
    std::string pattern = "ABABCABAB";
    if (RabinKarp(text, pattern)) {
        std::cout << "Pattern found!" << std::endl;
    } else {
        std::cout << "Pattern not found!" << std::endl;
    }
    return 0;
}

Rabin-Karp算法在处理大量模式串时表现出色,但其性能依赖于哈希函数的选择和冲突处理,实际应用中需要谨慎选择参数。

在实际项目中,我发现这些算法的选择往往取决于具体的应用场景和性能需求。例如,在处理基因序列匹配时,KMP算法和Boyer-Moore算法表现出色;而在处理大量模式串的文本搜索引擎中,Rabin-Karp算法则更具优势。

总结一下,C++中的字符串匹配算法各有千秋,选择合适的算法需要综合考虑文本大小、模式串长度、性能需求等因素。在实际应用中,不断优化和调整算法实现,才能更好地满足用户需求。希望这些分享能为你提供一些启发和帮助。

相关专题

更多
js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

246

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

204

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1429

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

606

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

546

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

539

2024.04.29

go语言字符串相关教程
go语言字符串相关教程

本专题整合了go语言字符串相关教程,阅读专题下面的文章了解更多详细内容。

157

2025.07.29

c++字符串相关教程
c++字符串相关教程

本专题整合了c++字符串相关教程,阅读专题下面的文章了解更多详细内容。

77

2025.08.07

ip地址修改教程大全
ip地址修改教程大全

本专题整合了ip地址修改教程大全,阅读下面的文章自行寻找合适的解决教程。

81

2025.12.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 8万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 6.9万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号