独立事件组合概率与收益估算：构建总收益概率分布曲线

碧海醫心

发布时间：2025-10-12 13:33:05

600人浏览过

来源于php中文网

原创

独立事件组合概率与收益估算：构建总收益概率分布曲线

本文详细介绍了如何将多个独立事件（如商业项目）的成功概率及其关联收益（如工时）结合起来，以估算获得特定总收益的概率。通过枚举所有可能的事件组合，计算每个组合的发生概率和总收益，最终构建出总收益的概率分布，从而为业务预测提供量化依据。

问题背景与目标

在商业预测中，我们经常面临一系列独立的潜在项目或任务。每个项目都有其独立的成功概率以及成功后带来的特定收益（例如，工时、收入等）。我们的目标是理解所有这些项目组合起来，最终能够获得的总收益的概率分布，或者更具体地，计算获得超过某个特定收益阈值的总概率。例如，假设我们有25个潜在的客户项目，每个项目都有不同的中标概率和预估工时。我们希望知道，在所有项目都独立进行的情况下，获得总工时达到100小时的概率是多少。

这个问题不能简单地通过累积相乘或平均概率来解决，因为每个项目都是独立的，并且不同的项目组合会产生不同的总收益和相应的概率。我们需要一种方法来系统地考虑所有可能的项目结果。

核心原理：穷举所有可能情景

解决这类问题的核心思想是穷举所有可能的事件组合，计算每个组合的发生概率和其对应的总收益。

事件的二元性：每个独立事件（如一个项目）只有两种结果：成功或失败。
- 如果项目成功，其概率为 p，并带来相应的收益 R。
- 如果项目失败，其概率为 1 - p，收益为 0。
情景的生成：对于 n 个独立事件，每个事件有两种可能结果，因此总共有 2^n 种不同的情景（即所有项目成功和失败的组合）。例如，如果有3个项目，就有 2^3 = 8 种情景。这些情景是相互排斥的。
情景的概率计算：一个特定情景的发生概率是该情景中所有项目结果概率的乘积。
- 如果项目 i 在该情景中成功，则乘以其成功概率 p_i。
- 如果项目 i 在该情景中失败，则乘以其失败概率 (1 - p_i)。
情景的总收益计算：一个特定情景的总收益是该情景中所有成功项目收益的总和。

通过计算所有 2^n 种情景的概率和收益，我们就能获得一个详细的、离散的概率分布。

Python 实现详解

我们将使用Python来演示如何实现这一过程。

1. 数据准备

首先，定义我们的项目数据，包括项目名称、成功概率和预估工时。

萝卜简历

免费在线AI简历制作工具，帮助求职者轻松完成简历制作。

下载

jobs = ['job1', 'job2', 'job3', 'job4', 'job5']
probabilities = [0.1, 0.1, 0.4, 0.6, 0.2] # 对应每个项目的成功概率
hours = [1, 10, 43, 2, 5] # 对应每个项目成功后的工时收益
min_hours_desired = 10 # 我们希望计算达到或超过这个工时的概率

2. 生成所有情景

每个情景可以用一个二进制字符串表示，其中 '1' 表示项目成功，'0' 表示项目失败。例如，对于5个项目，00101 表示 job3 和 job5 成功，其他项目失败。

scenarios = []
jobs_len = len(jobs)
for i in range(2**jobs_len):
    # 将整数i转换为二进制字符串，并用0填充到jobs_len长度
    scenario = bin(i).split('b')[1].zfill(jobs_len)
    scenarios.append(scenario)

print(f"生成的总情景数: {len(scenarios)}")
# 示例：打印前几个情景
# for s in scenarios[:5]:
#     print(s)

3. 计算每个情景的概率与总收益

遍历每个生成的情景，计算其发生概率和总工时。

scenario_outcomes = []
for scenario in scenarios:
    scenario_hours_won = 0
    scenario_probability = 1.0 # 使用浮点数确保精确计算
    for j, b in enumerate(scenario):
        if b == '0': # 项目失败
            scenario_probability *= (1 - probabilities[j])
        else: # 项目成功
            scenario_probability *= probabilities[j]
            scenario_hours_won += hours[j]
    scenario_outcomes.append((scenario, scenario_probability, scenario_hours_won))

# 打印部分情景的计算结果作为示例
print("\n部分情景的概率与收益：")
for outcome in scenario_outcomes[:5]:
    print(f"情景: {outcome[0]}, 概率: {outcome[1]:.6f}, 总工时: {outcome[2]}")

4. 示例：计算达到特定收益的概率

有了每个情景的概率和收益，我们可以很容易地计算出达到或超过 min_hours_desired 的总概率。由于所有情景是互斥的，我们只需将满足条件的情景的概率相加。

prob_desired_hours = sum([o[1] for o in scenario_outcomes if o[2] > min_hours_desired])
print(f'\n获得大于 {min_hours_desired} 小时的总概率: {prob_desired_hours:.6f}')

# 验证所有情景的概率之和是否为1
prob_check = sum([o[1] for o in scenario_outcomes])
print(f'所有情景概率之和 (应为1): {prob_check:.6f}')

5. 构建收益-概率分布

为了生成“曲线”或更准确地说是离散的概率分布图，我们需要将具有相同总工时的情景的概率进行累加。

import collections

# 使用defaultdict来累加相同工时的概率
payout_probabilities = collections.defaultdict(float)

for _, prob, payout in scenario_outcomes:
    payout_probabilities[payout] += prob

# 将结果转换为字典并按工时排序，方便后续绘图
sorted_payout_probabilities = dict(sorted(payout_probabilities.items()))

import json
print("\n总工时及其对应概率分布：")
print(json.dumps(sorted_payout_probabilities, indent=2))

# 进一步，我们可以用matplotlib等库将这个分布绘制成柱状图或散点图。
# import matplotlib.pyplot as plt
#
# payouts = list(sorted_payout_probabilities.keys())
# probabilities_values = list(sorted_payout_probabilities.values())
#
# plt.figure(figsize=(10, 6))
# plt.bar(payouts, probabilities_values, width=1.0, edgecolor='black')
# plt.xlabel('总工时')
# plt.ylabel('发生概率')
# plt.title('总工时概率分布')
# plt.xticks(rotation=45)
# plt.grid(axis='y', linestyle='--', alpha=0.7)
# plt.tight_layout()
# plt.show()

性能考量与注意事项

指数级复杂度：上述方法的时间复杂度是 O(2^n)，其中 n 是项目的数量。这意味着随着项目数量的增加，计算时间将呈指数级增长。
- 对于 n=5， 2^5 = 32 种情景，计算速度极快。
- 对于 n=25， 2^25 ≈ 3.3 * 10^7 种情景，虽然计算量大，但在现代计算机上通常可以在一分钟左右完成。
- 对于 n=30， 2^30 ≈ 10^9 种情景，计算时间会显著增加。
- 对于 n > 30，这种蛮力方法可能变得不切实际，需要考虑其他近似方法，例如蒙特卡洛模拟。
“曲线”的理解：在问题描述中提到的“曲线”，实际上更准确地讲是一个离散的概率分布（或称概率质量函数）。当项目数量和可能的总收益值很多时，这个离散分布在视觉上会呈现出类似连续曲线的形状。
数据类型：在计算概率时，务必使用浮点数（例如 1.0 而不是 1）以避免整数运算带来的精度问题。

总结

通过穷举所有独立事件的组合情景，并计算每个情景的发生概率和总收益，我们可以有效地构建出总收益的概率分布。这种方法对于项目数量在25-30个以内的场景是可行的，能够为业务决策者提供关于不同总收益水平的量化概率预测。当项目数量非常大时，需要探索更高效的近似算法来处理计算复杂度。

如何准确识别运行环境：区分 MSYS2、PowerShell 与 CMD

如何批量请求多个URL并将结果合并保存为CSV文件

Python requests.get 响应编码不一致问题的根源与解决方案

Python 进程池 Pool 的任务分发机制

Python 中排序为什么如此灵活？

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

769

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

661

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

764

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

659

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1345

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

549

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

730

2023.08.11