0

0

提取字符串中特定格式的数值(如价格和序列号)的完整教程

聖光之護

聖光之護

发布时间:2026-01-27 14:30:02

|

799人浏览过

|

来源于php中文网

原创

提取字符串中特定格式的数值(如价格和序列号)的完整教程

本文介绍如何从非结构化文本中精准提取带逗号的价格(如 `15,000`)和纯数字序列号(如 `02604800000734987654`),重点解决 `is_numeric()` 对含逗号数字失效的问题,并提供基于 `str_replace` 的稳健方案与正则表达式两种专业级实现方法。

在实际开发中,我们常需从日志、票据或OCR识别后的杂乱文本中提取关键字段(如金额、单号、日期等)。但原始字符串缺乏固定分隔符或标准结构,直接使用 explode() + is_numeric() 往往失败——因为 PHP 的 is_numeric("15,000") 返回 false:它仅识别整数、浮点数及科学计数法格式,不支持千位分隔符(,)

✅ 推荐方案一:预处理 + 分词过滤(简洁可靠)

该方法逻辑清晰、易调试、容错性强,适合字段位置相对稳定、数量较少的场景:

$string = "hdahdsa jkasdhjsa USD 15,000 jshads hduasdo SN : 02604800000734987654 at  17/02/2022 18:04:47. Blabla bla bla sdsad dsada ";

// 按空格分割,逐词处理
$words = preg_split('/\s+/', trim($string), -1, PREG_SPLIT_NO_EMPTY);
$matches = [];

foreach ($words as $word) {
    // 移除逗号后判断是否为纯数字(支持 "15,000"、"026048...")
    $clean = str_replace(',', '', $word);
    if (ctype_digit($clean) && strlen($clean) >= 8) { // 序列号通常较长,加长度过滤更安全
        $matches[] = $word;
    } elseif (ctype_digit($clean) && strpos($word, ',') !== false) { // 明确含逗号 → 视为价格
        $matches[] = $word;
    }
}

// 按业务逻辑分配变量(假设价格总在序列号之前)
$price = $matches[0] ?? null;
$sn    = $matches[1] ?? null;

echo "Price: $price\n"; // 输出: Price: 15,000
echo "SN: $sn\n";       // 输出: SN: 02604800000734987654
⚠️ 注意:ctype_digit() 比 is_numeric() 更严格(仅接受纯数字字符串),避免误匹配 1e5 或 -123 等非预期值;配合 strpos($word, ',') 可明确区分价格与长序列号。

✅ 推荐方案二:正则表达式精准捕获(高精度、可扩展)

当文本模式较固定(如 "USD " 后紧跟 "SN : "),正则表达式是最佳选择,语义明确且性能优秀:

MOKI
MOKI

MOKI是美图推出的一款AI短片创作工具,旨在通过AI技术自动生成分镜图并转为视频素材。

下载
$string = "hdahdsa jkasdhjsa USD 15,000 jshads hduasdo SN : 02604800000734987654 at  17/02/2022 18:04:47. Blabla bla bla sdsad dsada ";

// 匹配:USD 后的带逗号数字(价格) + SN : 后的连续数字(序列号)
if (preg_match('/USD\s+([0-9,]+).*?SN\s*:\s*([0-9]+)/s', $string, $matches)) {
    $price = $matches[1]; // "15,000"
    $sn    = $matches[2]; // "02604800000734987654"

    echo "Price: $price\n";
    echo "SN: $sn\n";
} else {
    echo "Failed to extract required fields.\n";
}
  • /s 修饰符使 . 可匹配换行符,增强鲁棒性;
  • .*? 是非贪婪匹配,确保准确捕获两个目标间最短内容;
  • 括号 () 形成捕获组,$matches[1] 和 $matches[2] 即对应价格与序列号。

? 总结与选型建议

方案 适用场景 优点 风险提示
预处理 + 分词 字段位置不严格、需兼容多种变体(如 USD, EUR, SN:, Serial No:) 逻辑透明、易于添加业务规则(如长度校验、前缀判断) 需注意空格/标点干扰,建议用 preg_split('/\s+/', ...) 替代 explode()
正则捕获 文本结构相对稳定、需高精度定位 一行匹配、性能好、可复用性强 正则编写需谨慎,过度宽松(如 .*)易导致误匹配,建议用 .*? 并锚定关键词

无论采用哪种方式,切勿直接依赖 is_numeric() 处理含格式符号的数字。始终先清洗(去逗号、空格等),再验证;关键业务字段务必增加存在性检查(?? null 或 isset()),避免未定义变量错误。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

510

2023.06.20

正则表达式不包含
正则表达式不包含

正则表达式,又称规则表达式,,是一种文本模式,包括普通字符和特殊字符,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章,希望对大家能有所帮助。

251

2023.07.05

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

745

2023.07.05

java正则表达式匹配字符串
java正则表达式匹配字符串

在Java中,我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容,帮助大家解决问题。

213

2023.08.11

正则表达式空格
正则表达式空格

正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。本专题为大家提供正则表达式相关的文章、下载、课程内容,供大家免费下载体验。

351

2023.08.31

Python爬虫获取数据的方法
Python爬虫获取数据的方法

Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据,或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

293

2023.11.13

正则表达式空格如何表示
正则表达式空格如何表示

正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。想了解更多正则表达式空格怎么表示的内容,可以访问下面的文章。

236

2023.11.17

正则表达式中如何匹配数字
正则表达式中如何匹配数字

正则表达式中可以通过匹配单个数字、匹配多个数字、匹配固定长度的数字、匹配整数和小数、匹配负数和匹配科学计数法表示的数字的方法匹配数字。更多关于正则表达式的相关知识详情请看本专题下面的文章。php中文网欢迎大家前来学习。

531

2023.12.06

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

9

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 9.7万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.2万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号