
OptaPlanner通过层级比较(硬性、中性、软性)评估解决方案,高分代表优解。文章将深入解释其评分机制,阐明为何负分组件可能仍存在于“最优”方案中,并指导如何通过精准定义硬性约束来强制拒绝不符合业务底线的解决方案,确保优化结果符合预期。
在资源调度和排班优化等复杂场景中,OptaPlanner作为一款强大的开源规划引擎,能够帮助用户找到最优解决方案。然而,有效地利用OptaPlanner的关键在于正确地定义和理解其评分机制。许多用户在实践中可能会遇到这样的困惑:即使某些解决方案包含负分(即存在某些违规),OptaPlanner仍然将其选为“最优”,这似乎与直觉相悖。本文将深入探讨OptaPlanner的评分原理,并指导如何通过精确的约束建模来强制“拒绝”不符合业务底线的解决方案。
1. OptaPlanner评分机制概述
OptaPlanner通过Score对象来量化解决方案的质量。常见的得分类型包括HardSoftScore和HardMediumSoftScore,它们分别由硬性(Hard)、中性(Medium)和软性(Soft)分数组成。理解这些分数的含义至关重要:
- 分数是“奖励”而非“惩罚”: 在OptaPlanner中,更高的分数代表更好的解决方案。这意味着,当使用penalize方法定义约束时,它会产生负分数,表示对解决方案的“扣分”或“惩罚”。相反,reward方法会产生正分数,表示对解决方案的“奖励”或“加分”。
-
层级比较原则: OptaPlanner在比较两个解决方案的得分时,遵循严格的层级比较原则,从左到右,从最硬到最软进行。
- 硬性分数 (Hard Score) 具有最高优先级。 即使中性或软性分数极差,只要一个解决方案的硬性分数高于另一个,它就被视为更优。
- 只有当硬性分数完全相等时,才会比较中性分数。
- 只有当硬性分数和中性分数都完全相等时,才会比较软性分数。
示例解析:
假设我们有以下三个解决方案的得分:
- (-5hard/3medium/2soft)
- (-6hard/-1medium/0soft)
- (-1hard/0medium/0soft)
根据OptaPlanner的层级比较规则,它们的优劣顺序如下:
(-1hard/0medium/0soft) > (-5hard/3medium/2soft) > (-6hard/-1medium/0soft)
解释:
- (-1hard) 优于 (-5hard) 和 (-6hard),因为 -1 比 -5 和 -6 更接近零(或更高)。这意味着第一个解决方案只有1个硬性违规,而其他解决方案有更多。
- 在比较 (-5hard/3medium/2soft) 和 (-6hard/-1medium/0soft) 时,由于 -5hard 优于 -6hard,因此第一个解决方案被认为是更好的,即使它的中性分数 3medium 看起来不如另一个的 -1medium(实际上 -1medium 是一个惩罚,3medium 是一个奖励)。硬性分数的优势完全覆盖了中性分数的差异。
核心澄清:
如果你的评分函数导致 (6hard/-1medium/0soft) 被OptaPlanner视为优于 (5hard/3medium/2soft),这表明你的 6hard 实际上代表了更好的硬性得分(例如,6个硬性奖励点)。这与常见的“违规产生负分”的理解可能有所不同。在大多数业务场景中,我们使用 penalize 来表达违规,因此硬性分数通常是负数,且负数绝对值越小越好(例如,-1hard 优于 -2hard)。
2. 如何“拒绝”带有负分组件的解决方案
OptaPlanner本身并不会“拒绝”任何解决方案,它只会寻找在当前约束定义下分数最高的那个。如果一个解决方案包含负分但最终被选中,这说明在所有可能的解决方案中,它的得分是最高的。要实现用户期望的“拒绝”行为(例如,拒绝任何包含负分组件的解决方案),我们需要通过精确的约束建模来实现。
强制性拒绝策略:
如果某个条件是绝对不可接受的(即,一旦发生就意味着解决方案无效或不符合基本业务要求),它必须被建模为一个硬性约束。任何违反此硬性约束的行为都应导致一个负的硬性分数(例如,-1hard)。
示例场景分析:
场景一:硬性违规必须被避免 假设解决方案 A 是 (-1hard/5medium/10soft),解决方案 B 是 (0hard/-100medium/5soft)。OptaPlanner会选择 B,因为 0hard 优于 -1hard。这意味着解决方案 B 没有硬性违规,即使它的中性分数非常差,它仍然比有硬性违规的解决方案 A 更好。这符合“硬性约束不可违反”的业务逻辑。
场景二:中性违规在硬性分数相等时才比较 假设解决方案 C 是 (0hard/-1medium/0soft),解决方案 D 是 (0hard/5medium/0soft)。OptaPlanner会选择 D,因为硬性分数都为 0hard,然后比较中性分数,5medium 优于 -1medium。这也符合预期。
-
用户期望的“拒绝” (6hard/-1medium/0soft) 的情况分析: 如果你的业务逻辑是“即使硬性得分很高,但只要中性或软性分数为负,就应该拒绝”,这与OptaPlanner的层级比较机制存在冲突。
- 重新定义硬性分数: 最直接的方法是,如果 6hard 实际上代表了某种违规,那么你的评分函数应该将其表示为 -6hard。在这种情况下,(-6hard/-1medium/0soft) 肯定会比 (-5hard/3medium/2soft) 差,从而被“拒绝”。
- 提升约束层级: 如果某个导致 -1medium 的条件真的是不可接受的,那么它应该被提升为硬性约束。例如,










