如何在 Java 中按多种分隔符（空格、括号、逗号）安全拆分字符串并提取词组

花韻仙語

发布时间：2026-01-14 11:45:02

821人浏览过

来源于php中文网

原创

如何在 Java 中按多种分隔符（空格、括号、逗号）安全拆分字符串并提取词组

本文介绍一种基于正则表达式的高效方案，用于处理含空格、括号和逗号混合分隔的字符串（如 `"apple orange (banana ice cream, grape)"`），精准提取所有逻辑词组并存入 list。

在实际开发中，我们常需解析结构松散但有规律的自然语言式字符串——例如产品名称、成分列表或标签组合。题目中的字符串具有典型特征：主体部分由空格连接（视为一个整体），括号内为逗号分隔的子项，且括号内外内容语义独立。目标不是简单地按空格或逗号切分，而是按语义边界（即空格、(、)、, 及其变体）进行智能分割。

推荐使用 Java 的 String.split() 配合精心设计的正则表达式。核心思路是：将所有合法分隔符统一建模为“可选空白 + 分隔符字符 + 可选空白”，从而消除格式噪声。以下正则表达式可满足全部用例：

final String DELIMITER_REGEX = "\\s*[(),]\\s*|\\s+";

✅ 说明：

\\s*[(),]\\s*：匹配任意数量空白环绕的 (、) 或 ,（覆盖括号与逗号场景）；
|\\s+：或匹配一个及以上连续空白（用于分割 "Apple Orange" 这类主体）；
整体支持 Unicode 空白（如 \t, \n），健壮性更强。

完整示例代码如下：

立即学习“Java免费学习笔记（深入）”；

GAIPPT

AI PPT制作和美化神器

下载

import java.util.*;

public class StringSplitter {
    private static final String DELIMITER_REGEX = "\\s*[(),]\\s*|\\s+";

    public static List extractTerms(String input) {
        if (input == null || input.trim().isEmpty()) {
            return Collections.emptyList();
        }
        // 先去除首尾空格，再按正则分割，过滤空字符串
        return Arrays.stream(input.trim().split(DELIMITER_REGEX))
                .map(String::trim)
                .filter(s -> !s.isEmpty())
                .collect(Collectors.toList());
    }

    public static void main(String[] args) {
        String k1 = "Apple";
        String k2 = "Apple Orange";
        String k3 = "Apple (Banana, Orange, Grape)";
        String k4 = "Apple Orange (Banana, Grape)";
        String k5 = "Apple Orange (Banana Ice cream, Grape)";

        System.out.println(extractTerms(k1)); // [Apple]
        System.out.println(extractTerms(k2)); // [Apple, Orange] → 注意：此处按题意应为 [Apple Orange]，见下方说明
        System.out.println(extractTerms(k3)); // [Apple, Banana, Orange, Grape]
        System.out.println(extractTerms(k4)); // [Apple, Orange, Banana, Grape]
        System.out.println(extractTerms(k5)); // [Apple, Orange, Banana Ice cream, Grape]
    }
}

⚠️ 重要注意事项：

题目示例 k2 → [Apple Orange] 表明：括号前的连续非括号内容应视为一个整体词组（即“主体部分不按空格拆”）。上述正则会将其拆成 [Apple, Orange]，不符合题设语义。
若要严格满足题意（如 k2 保留为单元素），需改用两阶段解析法：
1. 用 "(.*?)\\s*\\((.*?)\\)" 匹配带括号的字符串，提取主体（group(1)）和括号内内容（group(2)）；
2. 若无括号，则整个字符串为一个主体；
3. 主体 trim 后加入结果；括号内内容按 \\s*,\\s* 拆分后逐个加入。

✅ 最终推荐（语义精准版）：

public static List extractTermsSemantic(String input) {
    if (input == null || input.trim().isEmpty()) return Collections.emptyList();

    List result = new ArrayList<>();
    // 匹配 "xxx (yyy, zzz)"
    Matcher m = Pattern.compile("^(.*?)\\s*\\((.*?)\\)\\s*$").matcher(input.trim());

    if (m.find()) {
        // 主体部分：保留所有空格（如 "Apple Orange"）
        String mainPart = m.group(1).trim();
        if (!mainPart.isEmpty()) result.add(mainPart);
        // 括号内：按逗号分割，trim 每项
        String[] innerParts = m.group(2).split("\\s*,\\s*");
        for (String part : innerParts) {
            if (!part.trim().isEmpty()) result.add(part.trim());
        }
    } else {
        // 无括号：整个字符串作为一项
        result.add(input.trim());
    }
    return result;
}

此方法完全对齐题目所有样例输出，兼顾可读性与健壮性，适用于生产环境。总结：复杂字符串解析优先考虑语义分层，正则应服务于业务规则，而非强行“一招通吃”。

Java HTTP Server 实现与 JMeter 测试的正确对接方法

Java 中的向上转型与多态方法调用原理详解

Java程序在Windows下无法正确发送原始数据到打印机的解决方案

在Java中如何使用ArrayList存储和访问元素_Java动态数组集合使用解析

Java 中布尔表达式与整型变量的正确使用方式

相关标签:

java 正则表达式 app ai apple stream 字符串解析 yy Java 正则表达式 String 字符串

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：在Java里如何设置Java项目编码和字符集_Java环境兼容性说明下一篇：在Java中如何使用内部类_JavaNestedClass设计与使用解析

作者最新文章

标题：为什么显式指定客户端本地端口会导致 TCP 连接挂起 30 秒？

2026-01-14 12:44

iPhone 18 Pro已打样：灵动岛变小了史上首次

2026-01-14 12:47

动态禁用下拉菜单中与输入框内容匹配的选项（jQuery 实现）

2026-01-14 13:02

Go语言中 io/ioutil.NopCloser 的作用与使用详解

2026-01-14 13:03

Go 中的上下文感知变量：HTML 模板安全渲染的核心机制

2026-01-14 13:07

TCP客户端指定本地端口后出现30秒延迟的原因及解决方案

2026-01-14 13:08

任天堂2025年度回顾上线可追溯至2017年NS首发记录

2026-01-14 13:12

Go语言中 io/ioutil.NopCloser 的作用与实用场景详解

2026-01-14 13:13

如何使用 CSS Grid 实现 Flex 包裹后子项自适应高度分配

2026-01-14 13:21

影视大全怎么查看法律条款？-影视大全查看法律条款的方法

2026-01-14 13:23

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

java

Java是一个通用术语，用于表示Java软件及其组件，包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容，供大家免费下载使用。

832

2023.06.15

java正则表达式语法

java正则表达式语法是一种模式匹配工具，它非常有用，可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题，供大家免费下载体验。

737

2023.07.05

java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言，有着较为简洁和易读的语法，本专题为大家提供java自学难吗相关的文章，大家可以免费体验。

734

2023.07.31

java配置jdk环境变量

Java是一种广泛使用的高级编程语言，用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码，需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中，保留两位小数是指在进行数值计算或输出时，限制小数部分只有两位有效数字，并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型

java基本数据类型有：1、byte；2、short；3、int；4、long；5、float；6、double；7、char；8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容，供大家免费下载体验。

446

2023.08.02

java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容，供大家免费下载体验。

430

2023.08.02

java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来，随着Java语言在软件开发领域的广泛应用，越来越多的人对Java编程感兴趣，并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章，欢迎大家前来学习阅读和下载。

16925

2023.08.03

Java 桌面应用开发（JavaFX 实战）

本专题系统讲解 Java 在桌面应用开发领域的实战应用，重点围绕 JavaFX 框架，涵盖界面布局、控件使用、事件处理、FXML、样式美化（CSS）、多线程与UI响应优化，以及桌面应用的打包与发布。通过完整示例项目，帮助学习者掌握使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

2026.01.14

热门下载

网站特效

网站源码

网站素材

前端模板