0

0

如何使用 Go 正则表达式提取带引号字符串中 @en 前的纯文本内容

心靈之曲

心靈之曲

发布时间:2025-12-30 14:40:02

|

659人浏览过

|

来源于php中文网

原创

如何使用 Go 正则表达式提取带引号字符串中 @en 前的纯文本内容

本文介绍在 go 中通过预编译正则表达式高效处理形如 `"abraham lincoln" @en` 的字符串,精准提取引号内文本并移除 `@en` 及其前导空格与引号。

在国际化(i18n)或 RDF/JSON-LD 等数据格式中,常见类似 "Label" @en 的语言标记字符串。若需统一清洗为纯文本(如 Abraham Lincoln),推荐使用 *预编译的 `regexp.Regexp** ——它比每次调用regexp.Compile` 更高效,尤其适用于高频处理场景。

核心正则逻辑:

  • "([^"]*)":匹配一对双引号,并捕获其中不含引号的任意字符(非贪婪);
  • *@en:匹配零个或多个空格后紧跟字面量 @en;
  • 替换为 ${1} 即仅保留第一组捕获的内容(即引号内的原始文本)。

以下是完整、可运行的示例代码:

package main

import (
    "fmt"
    "regexp"
)

func main() {
    s := `"Abraham Lincoln" @en`
    // 预编译正则:精确匹配引号内内容 + 可选空格 + "@en"
    reg := regexp.MustCompile(`"([^"]*)" *@en`)
    result := reg.ReplaceAllString(s, "${1}")
    fmt.Println(result) // 输出:Abraham Lincoln
}

注意事项与进阶建议

Proface Avatarize
Proface Avatarize

一个利用AI技术提供高质量专业头像和头像的工具

下载
  • 若 @en 后可能跟其他内容(如 @en . 或 @en;),或引号后存在不可见空白(如制表符、换行),建议增强正则为:
    `"([^"]*)"\s*@[a-z]{2}(?:\s|$)`

    并配合 ReplaceAllStringFunc 或 FindStringSubmatch 实现更鲁棒的匹配。

  • 若输入可能不包含 @en,ReplaceAllString 会原样返回,无副作用;但若需严格校验格式,应先用 reg.MatchString() 判断。
  • 对于超大规模批量处理(如百万级字符串),可考虑避免正则、改用 strings.Index + strings.Trim 手动解析,性能提升显著(无回溯开销)。

总结:regexp.MustCompile 是 Go 中处理此类结构化文本清洗的标准且可靠方案——简洁、可读、易维护,兼顾正确性与工程实用性。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

402

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

528

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

306

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

74

2025.09.10

js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

506

2023.06.20

正则表达式不包含
正则表达式不包含

正则表达式,又称规则表达式,,是一种文本模式,包括普通字符和特殊字符,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章,希望对大家能有所帮助。

247

2023.07.05

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

722

2023.07.05

java正则表达式匹配字符串
java正则表达式匹配字符串

在Java中,我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容,帮助大家解决问题。

209

2023.08.11

excel制作动态图表教程
excel制作动态图表教程

本专题整合了excel制作动态图表相关教程,阅读专题下面的文章了解更多详细教程。

30

2025.12.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
WEB前端教程【HTML5+CSS3+JS】
WEB前端教程【HTML5+CSS3+JS】

共101课时 | 8.1万人学习

JS进阶与BootStrap学习
JS进阶与BootStrap学习

共39课时 | 3.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号