
在商业预测中,我们经常面临一系列独立的潜在项目或任务。每个项目都有其独立的成功概率以及成功后带来的特定收益(例如,工时、收入等)。我们的目标是理解所有这些项目组合起来,最终能够获得的总收益的概率分布,或者更具体地,计算获得超过某个特定收益阈值的总概率。例如,假设我们有25个潜在的客户项目,每个项目都有不同的中标概率和预估工时。我们希望知道,在所有项目都独立进行的情况下,获得总工时达到100小时的概率是多少。
这个问题不能简单地通过累积相乘或平均概率来解决,因为每个项目都是独立的,并且不同的项目组合会产生不同的总收益和相应的概率。我们需要一种方法来系统地考虑所有可能的项目结果。
解决这类问题的核心思想是穷举所有可能的事件组合,计算每个组合的发生概率和其对应的总收益。
事件的二元性:每个独立事件(如一个项目)只有两种结果:成功或失败。
情景的生成:对于 n 个独立事件,每个事件有两种可能结果,因此总共有 2^n 种不同的情景(即所有项目成功和失败的组合)。例如,如果有3个项目,就有 2^3 = 8 种情景。这些情景是相互排斥的。
情景的概率计算:一个特定情景的发生概率是该情景中所有项目结果概率的乘积。
情景的总收益计算:一个特定情景的总收益是该情景中所有成功项目收益的总和。
通过计算所有 2^n 种情景的概率和收益,我们就能获得一个详细的、离散的概率分布。
我们将使用Python来演示如何实现这一过程。
首先,定义我们的项目数据,包括项目名称、成功概率和预估工时。
jobs = ['job1', 'job2', 'job3', 'job4', 'job5'] probabilities = [0.1, 0.1, 0.4, 0.6, 0.2] # 对应每个项目的成功概率 hours = [1, 10, 43, 2, 5] # 对应每个项目成功后的工时收益 min_hours_desired = 10 # 我们希望计算达到或超过这个工时的概率
每个情景可以用一个二进制字符串表示,其中 '1' 表示项目成功,'0' 表示项目失败。例如,对于5个项目,00101 表示 job3 和 job5 成功,其他项目失败。
scenarios = []
jobs_len = len(jobs)
for i in range(2**jobs_len):
# 将整数i转换为二进制字符串,并用0填充到jobs_len长度
scenario = bin(i).split('b')[1].zfill(jobs_len)
scenarios.append(scenario)
print(f"生成的总情景数: {len(scenarios)}")
# 示例:打印前几个情景
# for s in scenarios[:5]:
# print(s)遍历每个生成的情景,计算其发生概率和总工时。
scenario_outcomes = []
for scenario in scenarios:
scenario_hours_won = 0
scenario_probability = 1.0 # 使用浮点数确保精确计算
for j, b in enumerate(scenario):
if b == '0': # 项目失败
scenario_probability *= (1 - probabilities[j])
else: # 项目成功
scenario_probability *= probabilities[j]
scenario_hours_won += hours[j]
scenario_outcomes.append((scenario, scenario_probability, scenario_hours_won))
# 打印部分情景的计算结果作为示例
print("\n部分情景的概率与收益:")
for outcome in scenario_outcomes[:5]:
print(f"情景: {outcome[0]}, 概率: {outcome[1]:.6f}, 总工时: {outcome[2]}")有了每个情景的概率和收益,我们可以很容易地计算出达到或超过 min_hours_desired 的总概率。由于所有情景是互斥的,我们只需将满足条件的情景的概率相加。
prob_desired_hours = sum([o[1] for o in scenario_outcomes if o[2] > min_hours_desired])
print(f'\n获得大于 {min_hours_desired} 小时的总概率: {prob_desired_hours:.6f}')
# 验证所有情景的概率之和是否为1
prob_check = sum([o[1] for o in scenario_outcomes])
print(f'所有情景概率之和 (应为1): {prob_check:.6f}')为了生成“曲线”或更准确地说是离散的概率分布图,我们需要将具有相同总工时的情景的概率进行累加。
import collections
# 使用defaultdict来累加相同工时的概率
payout_probabilities = collections.defaultdict(float)
for _, prob, payout in scenario_outcomes:
payout_probabilities[payout] += prob
# 将结果转换为字典并按工时排序,方便后续绘图
sorted_payout_probabilities = dict(sorted(payout_probabilities.items()))
import json
print("\n总工时及其对应概率分布:")
print(json.dumps(sorted_payout_probabilities, indent=2))
# 进一步,我们可以用matplotlib等库将这个分布绘制成柱状图或散点图。
# import matplotlib.pyplot as plt
#
# payouts = list(sorted_payout_probabilities.keys())
# probabilities_values = list(sorted_payout_probabilities.values())
#
# plt.figure(figsize=(10, 6))
# plt.bar(payouts, probabilities_values, width=1.0, edgecolor='black')
# plt.xlabel('总工时')
# plt.ylabel('发生概率')
# plt.title('总工时概率分布')
# plt.xticks(rotation=45)
# plt.grid(axis='y', linestyle='--', alpha=0.7)
# plt.tight_layout()
# plt.show()指数级复杂度:上述方法的时间复杂度是 O(2^n),其中 n 是项目的数量。这意味着随着项目数量的增加,计算时间将呈指数级增长。
“曲线”的理解:在问题描述中提到的“曲线”,实际上更准确地讲是一个离散的概率分布(或称概率质量函数)。当项目数量和可能的总收益值很多时,这个离散分布在视觉上会呈现出类似连续曲线的形状。
数据类型:在计算概率时,务必使用浮点数(例如 1.0 而不是 1)以避免整数运算带来的精度问题。
通过穷举所有独立事件的组合情景,并计算每个情景的发生概率和总收益,我们可以有效地构建出总收益的概率分布。这种方法对于项目数量在25-30个以内的场景是可行的,能够为业务决策者提供关于不同总收益水平的量化概率预测。当项目数量非常大时,需要探索更高效的近似算法来处理计算复杂度。
以上就是独立事件组合概率与收益估算:构建总收益概率分布曲线的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号