0

0

独立事件概率组合与收益预测:构建总收益概率分布函数

碧海醫心

碧海醫心

发布时间:2025-10-11 09:56:17

|

557人浏览过

|

来源于php中文网

原创

独立事件概率组合与收益预测:构建总收益概率分布函数

本文旨在解决如何结合一系列独立事件的成功概率及其关联收益,以预测总收益的概率分布。通过详细阐述暴力枚举法,我们将学习如何计算所有可能的事件组合(场景)的发生概率及对应的总收益,进而构建一个表示不同总收益发生概率的分布曲线。文章包含Python代码示例,适用于理解并实现此类概率预测模型。

理解独立事件与总收益预测

在业务预测中,我们常会遇到一系列相互独立的任务或项目,每个项目都有其独立的成功概率和预期的收益(例如,完成项目所需的小时数)。我们的目标是了解在所有这些独立项目共同作用下,获得特定总收益(例如,总工时)的概率是多少,或者获得超过某个阈值收益的概率是多少。由于项目之间相互独立,一个项目的成功与否不会影响其他项目的概率。

例如,我们有以下项目数据:

项目 成功概率 潜在工时
Job 1 0.4 40
Job 2 0.5 32
... ... ...

我们希望能够生成一个曲线,显示获得不同总工时的可能性。例如,获得少量工时(可能只需要完成一两个项目)的概率较高,而获得所有项目总工时(需要所有项目都成功)的概率则非常低。

构建概率模型:场景枚举法

由于每个项目都有“成功”或“失败”两种结果,且项目之间相互独立,我们可以通过枚举所有可能的项目结果组合来构建总收益的概率分布。如果存在 n 个项目,那么总共会有 2^n 种不同的结果场景。

对于每个特定的场景,其发生概率的计算方式如下:

  • 如果项目 i 在该场景中成功,则乘以其成功概率 P_i。
  • 如果项目 i 在该场景中失败,则乘以其失败概率 (1 - P_i)。
  • 该场景的总收益是所有成功项目的收益之和。

由于每个场景都是互斥的(即不可能同时发生两个不同的场景),因此,如果我们需要计算获得超过某个特定收益阈值的概率,只需将所有满足该条件的场景的概率相加即可。同理,要构建收益-概率分布,可以将具有相同总收益的所有场景的概率累加起来。

Python 实现示例

下面我们将通过一个简化的例子来演示如何用Python实现这一过程。假设我们有5个项目:

import json

# 示例数据
jobs = ['job1', 'job2', 'job3', 'job4', 'job5']
probabilities = [0.1, 0.1, 0.4, 0.6, 0.2]  # 对应每个项目的成功概率
hours = [1, 10, 43, 2, 5]                  # 对应每个项目的潜在工时
min_hours_desired = 10                     # 目标:计算获得超过10小时的概率

1. 生成所有可能的场景

每个场景可以用一个二进制字符串表示,其中 '1' 表示项目成功,'0' 表示项目失败。对于 n 个项目,从 0 到 2^n - 1 的每个整数都可以转换为一个二进制字符串,代表一个独特的场景。

百度MCP广场
百度MCP广场

探索海量可用的MCP Servers

下载
scenarios = []
jobs_len = len(jobs)
for i in range(2**jobs_len):
    # 将整数i转换为二进制字符串,并用0填充至jobs_len长度
    scenario = bin(i).split('b')[1].zfill(jobs_len)
    scenarios.append(scenario)

print(f"生成的场景数量: {len(scenarios)}")
# print(scenarios[:5]) # 打印前几个场景示例

2. 计算每个场景的概率和总收益

遍历每个生成的场景,计算其发生概率和对应的总工时收益。

scenario_outcomes = []
for scenario in scenarios:
    scenario_hours_won = 0
    scenario_probability = 1.0 # 使用浮点数确保精确计算
    for j, b in enumerate(scenario):
        if b == '0':  # 项目失败
            scenario_probability *= (1 - probabilities[j])
        else:         # 项目成功
            scenario_probability *= probabilities[j]
            scenario_hours_won += hours[j]
    scenario_outcomes.append((scenario, scenario_probability, scenario_hours_won))

# 打印部分场景结果,以便理解
print("\n部分场景的概率和收益示例:")
for i, outcome in enumerate(scenario_outcomes):
    if i < 5 or i > len(scenario_outcomes) - 5: # 打印开头和结尾的几个场景
        print(outcome)

3. 计算特定收益阈值的累积概率

有了每个场景的概率和收益,我们可以轻松计算出获得超过 min_hours_desired 工时的总概率。

prob_desired_hours = sum([o[1] for o in scenario_outcomes if o[2] > min_hours_desired])
print(f'\n获得超过 {min_hours_desired} 小时的总概率: {prob_desired_hours:.6f}')

# 验证所有场景的概率之和是否为1
prob_check = sum([o[1] for o in scenario_outcomes])
print(f'所有场景概率之和(应为1): {prob_check:.6f}')

4. 生成总收益-概率分布

为了绘制“曲线”(实际上是离散的柱状图),我们需要将具有相同总收益的所有场景的概率累加起来。

# 收集所有可能的总收益值
possible_payouts = set(o[2] for o in scenario_outcomes)
payout_probabilities = dict()

# 对每个可能的总收益,累加其对应的场景概率
for payout in possible_payouts:
    payout_probability = sum([o[1] for o in scenario_outcomes if o[2] == payout])
    payout_probabilities[payout] = payout_probability

print("\n总收益-概率分布:")
# 按照收益值排序输出,便于观察
sorted_payouts = sorted(payout_probabilities.items())
for payout, prob in sorted_payouts:
    print(f"  收益 {payout} 小时: 概率 {prob:.6f}")

# 更美观的JSON格式输出
# print(json.dumps(payout_probabilities, indent=2))

性能考量

需要注意的是,这种暴力枚举法的计算复杂度是 O(2^n),其中 n 是项目的数量。这意味着随着项目数量的增加,计算时间将呈指数级增长。对于少量项目(如本例中的5个),计算速度非常快。然而,当项目数量达到25个时,2^25 是一个非常大的数字(约3300万),虽然现代计算机可能在几分钟内完成计算,但对于更大规模的问题,这种方法将变得不可行。

对于 n 值较大的情况,可能需要考虑更高级的算法,例如动态规划、蒙特卡洛模拟或使用生成函数(Generating Functions)等方法来近似或精确计算概率分布,但这超出了本教程的范围。

总结

通过上述方法,我们成功地构建了一个模型,能够根据一系列独立事件的成功概率和潜在收益,计算出获得不同总收益的概率分布。这对于业务预测、风险评估和资源规划等场景具有重要意义。尽管暴力枚举法在项目数量较少时非常有效且直观,但在处理大量项目时,其计算效率会迅速下降,此时需要探索更优化的算法。理解这种基本方法是深入研究更复杂概率预测模型的基础。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

760

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

639

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

763

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

619

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1285

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

549

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

709

2023.08.11

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

11

2026.01.19

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 4.7万人学习

Django 教程
Django 教程

共28课时 | 3.2万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号