strings.Contains 是最轻量安全的关键词存在性判断方案,纯字面匹配、性能高,但仅返回 bool;需预处理空格和大小写,避免空关键词导致全量匹配。

用 strings.Contains 做简单关键词存在性判断
多数基础搜索场景只要求“某字符串是否包含关键词”,strings.Contains 是最轻量、最安全的选择。它不区分大小写,也不做正则解析,纯字面匹配,性能高且无意外行为。
注意:它只返回 bool,不提供位置或匹配次数。如果后续要高亮或分页,得换方案。
- 对用户输入的关键词,建议先用
strings.TrimSpace清除首尾空格,避免空匹配 - 若需忽略大小写,应统一转小写(
strings.ToLower),不要依赖第三方库做 case-insensitive 搜索——标准库没提供该变体 - 切忌直接拿用户输入进
strings.Contains后不做校验就返回结果:空关键词、全空格关键词会导致匹配全部内容
package mainimport ( "fmt" "strings" )
func simpleSearch(text, keyword string) bool { keyword = strings.TrimSpace(keyword) if keyword == "" { return false } return strings.Contains(strings.ToLower(text), strings.ToLower(keyword)) }
func main() { fmt.Println(simpleSearch("Go is awesome", "GO")) // true fmt.Println(simpleSearch("Hello world", " ")) // false }
用 strings.Index 和 strings.Fields 实现带位置与词元拆分的搜索
当需要知道关键词在原文中出现的位置,或想按“词”而非“子串”匹配(比如搜 "go" 不希望匹配到 "golang"),就得组合使用 strings.Index 和 strings.Fields 或 strings.FieldsFunc。
strings.Fields 按空白符切分,适合英文;中文需配合 runes 或分词库,此处不展开。重点是:**按词匹配必须先切分再遍历,不能靠 strings.Contains 硬搞**。
立即学习“go语言免费学习笔记(深入)”;
-
strings.Index返回首次出现位置,-1 表示未找到;多次调用可实现所有匹配位置收集 - 用
strings.Fields后逐个比对,记得统一大小写,否则"Go"≠"go" - 注意标点:英文句子末尾的
"go."会被Fields切成"go.",和"go"不等——如需干净匹配,得预处理标点(strings.Map+unicode.IsPunct)
package mainimport ( "fmt" "strings" "unicode" )
func wordSearch(text, keyword string) []int { keyword = strings.ToLower(strings.TrimSpace(keyword)) if keyword == "" { return nil }
words := strings.FieldsFunc(text, func(r rune) bool { return unicode.IsSpace(r) || unicode.IsPunct(r) }) var indices []int for i, w := range words { if strings.ToLower(w) == keyword { indices = append(indices, i) } } return indices}
func main() { fmt.Println(wordSearch("I love Go! Let's go.", "go")) // [2] }
用
regexp包做灵活模式匹配(但别滥用)真正需要通配、边界控制(如 \b)、或模糊拼写时,才上
regexp。它开销明显高于strings系函数,编译正则本身就有成本,且错误配置易导致回溯爆炸(尤其是用户可控输入)。常见踩坑:直接把用户输入塞进
regexp.Compile—— 未转义的.、*、[会引发 panic 或非预期行为。
- 始终用
regexp.QuoteMeta包裹用户输入的关键词,再拼进正则表达式 - 若只需完整词匹配,用
\b边界符:\\b+QuoteMeta(kw)+\\b - 避免用
.*开头的模式做长文本搜索;优先考虑FindAllStringIndex而非FindAllString,减少内存分配
package mainimport ( "fmt" "regexp" "strings" )
func regexSearch(text, keyword string) [][]int { keyword = strings.TrimSpace(keyword) if keyword == "" { return nil } pattern :=
(?i)\b+ regexp.QuoteMeta(keyword) +\bre := regexp.MustCompile(pattern) return re.FindAllStringIndex(text, -1) }func main() { fmt.Println(regexSearch("Go and golang are different", "go")) // [[0 2]] }
搜索结果结构化返回与常见遗漏点
实际接口中,前端通常需要:是否命中、匹配数、高亮 HTML 片段、摘要上下文。Golang 本身不内置这些,得手动组装。最容易被忽略的是 **编码安全** 和 **截断逻辑**。
- 返回高亮时,务必对原始文本做 HTML 转义(
html.EscapeString),再替换关键词为...,否则 XSS 风险 - 摘要提取别用
text[:n]硬截——可能在 UTF-8 字节中间切断,导致乱码;改用utf8string库或strings.RuneCountInString控制 rune 数量 - 搜索字段如果是数据库查出来的,注意
sql.NullString的零值处理:未设置时.String是空字符串,但.Valid为 false,直接传给搜索函数会误判
复杂搜索逻辑很快会超出标准库能力,比如权重排序、同义词扩展、拼音容错——这时候该考虑专用搜索引擎(如 Bleve、Meilisearch),而不是硬堆正则。










