如何在 Go 中正确解析多种日期格式的正则匹配结果

花韻仙語

发布时间：2026-01-25 13:10:11

489人浏览过

来源于php中文网

原创

如何在 Go 中正确解析多种日期格式的正则匹配结果

本文详解 go 中使用命名捕获组（`(?p...)`）匹配多格式日期时，如何避免子表达式名称冲突、安全提取字段并统一标准化输出。重点解决 `findallstringsubmatch` 返回的嵌套字节切片遍历难题。

在 Go 的 regexp 包中，命名捕获组不支持跨分支复用同一名称（如 (?P...) 在 A|B 的两个分支中重复定义），这是导致原始代码失败的根本原因。当正则表达式包含 |（或）操作符且各分支均含同名组时，SubexpNames() 会返回所有分支中所有组的名称（含重复），而 FindAllStringSubmatch 返回的每个匹配项字节切片（[][]byte）按全局子表达式索引顺序排列——即第 0 个元素是完整匹配，第 1~n 个对应 SubexpNames()[1:] 的每个组，但未匹配的分支组将为 nil。

因此，原始代码中 match[i][j] 直接索引会导致越界或空值混入，且无法区分哪一分支真正命中。正确的做法是：对每种日期格式单独编译正则，分别匹配、独立解析——这不仅语义清晰，还能规避命名冲突，并便于针对不同格式定制归一化逻辑（如月份转数字、年份补全等）。

以下是一个健壮、可扩展的实现方案：

Originality AI

专门为网络出版商设计的抄袭和AI检测工具

下载

package main

import (
    "fmt"
    "regexp"
    "strconv"
    "strings"
)

// monthNumFromName 将英文月份缩写转为两位数字
func monthNumFromName(m string) string {
    m = strings.ToLower(strings.TrimSpace(m))
    switch {
    case strings.HasPrefix(m, "jan"): return "01"
    case strings.HasPrefix(m, "feb"): return "02"
    case strings.HasPrefix(m, "mar"): return "03"
    case strings.HasPrefix(m, "apr"): return "04"
    case strings.HasPrefix(m, "may"): return "05"
    case strings.HasPrefix(m, "jun"): return "06"
    case strings.HasPrefix(m, "jul"): return "07"
    case strings.HasPrefix(m, "aug"): return "08"
    case strings.HasPrefix(m, "sep"): return "09"
    case strings.HasPrefix(m, "oct"): return "10"
    case strings.HasPrefix(m, "nov"): return "11"
    case strings.HasPrefix(m, "dec"): return "12"
    default:
        // 尝试解析为数字（支持 1-12 或 01-12）
        if i, err := strconv.Atoi(m); err == nil && i >= 1 && i <= 12 {
            return fmt.Sprintf("%02d", i)
        }
        return ""
    }
}

// normalizeYear 补全年份（2位→4位，默认 1950+ 归 20xx，否则 19xx）
func normalizeYear(y string) string {
    if len(y) == 4 {
        return y
    }
    if len(y) != 2 {
        return y // 无法处理，原样返回
    }
    if i, err := strconv.Atoi(y); err == nil {
        if i > 50 {
            return "19" + y
        }
        return "20" + y
    }
    return y
}

// padZero 将单数字字符串补零为两位
func padZero(s string) string {
    s = strings.TrimSpace(s)
    if len(s) == 1 {
        return "0" + s
    }
    return s
}

func main() {
    text := "February 6 2004 Jan 12th 56 1/12/2000 2013/12/1 1/12/1999"

    // 定义多种格式的正则（每种独立编译，无命名冲突）
    patterns := []struct {
        re    *regexp.Regexp
        parse func(map[string]string) string // 解析函数：输入命名组映射，输出标准日期字符串
    }{
        // MM/DD/YYYY 或 M/D/YYYY
        {
            regexp.MustCompile(`(?i)(?P\d{1,2})[/.-](?P\d{1,2})[/.-](?P\d{4})`),
            func(m map[string]string) string {
                return padZero(m["month"]) + "/" + padZero(m["day"]) + "/" + m["year"]
            },
        },
        // YYYY/MM/DD
        {
            regexp.MustCompile(`(?i)(?P\d{4})[/.-](?P\d{1,2})[/.-](?P\d{1,2})`),
            func(m map[string]string) string {
                return padZero(m["month"]) + "/" + padZero(m["day"]) + "/" + m["year"]
            },
        },
        // DD/MM/YYYY
        {
            regexp.MustCompile(`(?i)(?P\d{1,2})[/.-](?P\d{1,2})[/.-](?P\d{4})`),
            func(m map[string]string) string {
                return padZero(m["month"]) + "/" + padZero(m["day"]) + "/" + m["year"]
            },
        },
        // Month DD YYYY（如 January 12 2023）
        {
            regexp.MustCompile(`(?i)(?P[a-z]+)\s+(?P\d{1,2})\w*\s+(?P\d{4})`),
            func(m map[string]string) string {
                mm := monthNumFromName(m["month"])
                if mm == "" {
                    return ""
                }
                return mm + "/" + padZero(m["day"]) + "/" + m["year"]
            },
        },
        // DD Month YYYY（如 12 January 2023）
        {
            regexp.MustCompile(`(?i)(?P\d{1,2})\w*\s+(?P[a-z]+)\s+(?P\d{4})`),
            func(m map[string]string) string {
                mm := monthNumFromName(m["month"])
                if mm == "" {
                    return ""
                }
                return mm + "/" + padZero(m["day"]) + "/" + m["year"]
            },
        },
        // 支持两位年份（需补全）
        {
            regexp.MustCompile(`(?i)(?P\d{1,2})[/.-](?P\d{1,2})[/.-](?P\d{2})`),
            func(m map[string]string) string {
                y := normalizeYear(m["year"])
                return padZero(m["month"]) + "/" + padZero(m["day"]) + "/" + y
            },
        },
    }

    // 对每个模式执行匹配与解析
    for _, p := range patterns {
        matches := p.re.FindAllStringSubmatchIndex([]byte(text), -1)
        for _, match := range matches {
            // 提取命名组内容
            groups := make(map[string]string)
            for i, name := range p.re.SubexpNames() {
                if i == 0 || name == "" {
                    continue // 跳过完整匹配组和空名
                }
                start, end := match[2*i], match[2*i+1]
                if start >= 0 && end >= start {
                    groups[name] = string(text[start:end])
                } else {
                    groups[name] = ""
                }
            }
            // 解析并输出标准化日期
            if date := p.parse(groups); date != "" {
                fmt.Println("✅ Parsed:", date)
            }
        }
    }
}