应定义2–3个顶层业务异常基类(如BusinessException、SystemException、ValidationException)而非平级继承RuntimeException,以支持语义分组捕获、日志归类、可恢复性判断及精准测试;自定义异常需携带code和context等结构化信息,并避免存储大对象;受检异常仅用于调用方能且应立即处理的场景(如参数校验),非受检异常适用于系统故障等不可当场修复问题;全局异常处理器应仅记录堆栈、设HTTP状态码、返回精简JSON,禁用吞异常、外调告警或兜底NPE。

为什么不应该直接继承 Exception 或 RuntimeException 写一堆平级异常类
常见错误是为每个业务场景新建一个异常,比如 OrderCreateException、PaymentTimeoutException、UserNotFoundException,全部直接继承 RuntimeException。这样会导致:无法按语义分组捕获;日志归类困难;调用方无法预判哪些异常可恢复、哪些该熔断;测试时难以模拟特定异常分支。
合理做法是先定义 2–3 个顶层业务异常基类,再按领域或故障类型向下细化:
-
BusinessException(继承RuntimeException):表示业务规则不满足,如余额不足、状态非法,调用方可重试或引导用户修正 -
SystemException(继承RuntimeException):表示下游服务不可用、DB 连接失败等临时性系统问题,需监控+告警 -
ValidationException(继承Exception):用于入参校验失败,强制上层显式处理,避免脏数据流入
如何让自定义异常携带结构化上下文信息
单纯抛 new BusinessException("订单创建失败") 会丢失关键现场数据,导致排查时反复加日志。应在构造函数中支持传入业务 ID、请求 ID、原始错误码等,并提供统一序列化方法。
示例基类设计要点:
立即学习“Java免费学习笔记(深入)”;
系统简介:冰兔BToo网店系统采用高端技术架构,具备超强负载能力,极速数据处理能力、高效灵活、安全稳定;模板设计制作简单、灵活、多元;系统功能十分全面,商品、会员、订单管理功能异常丰富。秒杀、团购、优惠、现金、卡券、打折等促销模式十分全面;更为人性化的商品订单管理,融合了多种控制和独特地管理机制;两大模块无限级别的会员管理系统结合积分机制、实现有效的推广获得更多的盈利!本次更新说明:1. 增加了新
- 所有子类共用带
String code、Map的构造函数context - 重写
toString()或新增toLogString(),自动拼接 traceId + code + context - 避免在异常中存大对象(如整个 request body),防止 OOM 或 GC 压力
public class BusinessException extends RuntimeException {
private final String code;
private final Map context;
public BusinessException(String code, String message, Map context) {
super(message);
this.code = code;
this.context = Collections.unmodifiableMap(context);
}
public String toLogString(String traceId) {
return String.format("[%s] %s: %s | context=%s", traceId, code, getMessage(), context);
}
}
什么时候该用受检异常(Exception),什么时候用非受检(RuntimeException)
Java 的受检异常机制本意是强制处理可恢复的预期异常,但滥用会导致模板代码泛滥。判断标准不是“是否严重”,而是“调用方是否有能力且应该立即处理”:
- 用
Exception:参数合法性校验失败(如身份证格式错)、文件路径不存在但应由用户补填、第三方 API 明确返回 400 且需提示用户修改输入 - 用
RuntimeException:DB 连接超时、Redis 崩溃、NPE、空指针解引用——这些不是业务逻辑能当场修复的,应交由全局异常处理器统一记录、降级或返回友好提示 - 绝对不要把网络超时、SQL 异常包装成受检异常向上抛,这会让 service 层被迫写大量
try-catch却只做日志+再抛,违背设计初衷
全局异常处理器里不该做什么
Spring 的 @ControllerAdvice 是收口,但容易写过重。以下行为会掩盖问题本质或引入新风险:
- 把所有
RuntimeException都吞掉并返回 200 + { "code": 500, "msg": "系统繁忙" } —— 前端无法区分是服务宕机还是限流,也无法触发重试逻辑 - 在 handler 里调用外部服务(如发钉钉告警)—— 若告警服务也挂了,会导致异常处理链路卡死,甚至阻塞 Tomcat 线程
- 对
NullPointerException、ArrayIndexOutOfBoundsException做特殊响应 —— 这些是 bug,应该立刻修复,而不是“优雅兜底”
真正该做的只有三件事:记录带 traceId 的完整堆栈;根据异常类型设置 HTTP 状态码(如 BusinessException → 400,SystemException → 503);返回精简 JSON(不含堆栈、不含敏感字段)。









