Python中处理概率分布主要依赖scipy.stats和numpy。1. 离散型包括二项、泊松、几何和超几何分布,适用于整数取值随机变量;2. 连续型如正态、均匀、指数、伽玛、贝塔和对数正态分布,用于实数值变量;3. 多变量分布如多元正态分布,建模多变量联合分布;4. 自定义与经验分布可通过核密度估计和经验分布函数实现。scipy.stats提供pdf、cdf、rvs等统一接口,便于建模与推断。

Python中处理概率分布主要依赖于scipy.stats模块和numpy库,涵盖了几类常见的概率分布类型。以下是主要分类及常见示例:
1. 离散型概率分布
适用于取值为整数或有限/可数集合的随机变量。
-
二项分布(Binomial):模拟n次独立试验中成功次数,如抛硬币k次正面朝上。
使用:scipy.stats.binom -
泊松分布(Poisson):描述单位时间内事件发生次数,如每小时接到的电话数。
使用:scipy.stats.poisson -
几何分布(Geometric):首次成功所需的试验次数。
使用:scipy.stats.geom -
超几何分布(Hypergeometric):无放回抽样中的成功次数。
使用:scipy.stats.hypergeom
2. 连续型概率分布
适用于在区间内可取任意实数值的随机变量。
-
正态分布(Normal / Gaussian):最常用的分布,对称钟形曲线,如身高、测量误差。
使用:scipy.stats.norm -
均匀分布(Uniform):在区间[a, b]内等概率取值。
使用:scipy.stats.uniform -
指数分布(Exponential):描述事件间的时间间隔,常用于可靠性分析。
使用:scipy.stats.expon -
伽玛分布(Gamma):指数分布的推广,用于建模等待多个事件的时间。
使用:scipy.stats.gamma -
贝塔分布(Beta):定义在[0,1]区间,常用于表示概率的不确定性。
使用:scipy.stats.beta -
对数正态分布(Lognormal):变量的对数服从正态分布,适用于收入、房价等右偏数据。
使用:scipy.stats.lognorm
3. 多变量分布
用于多个随机变量联合分布的情况。
一、功能简介本软件完全适应大、中、小型网站建设需要,让您用很便宜的虚拟主机空间也可以开通4个独立的网站!久久企业网站后台管理系统各种版本开发基础架构均为php+mysql+div+css+伪静态,迎合搜索引擎排名的喜好。另外值得一提的是本站特色的TAG系统可为您的网站做出无限分类,不用任何设置全站ULR伪静态!本建站系统除了有产品发布、新闻(软文)发布、订单管理系统和留言反馈等一些最基本的功能之外
立即学习“Python免费学习笔记(深入)”;
-
多元正态分布(Multivariate Normal):多个正态变量的联合分布,考虑协方差结构。
使用:scipy.stats.multivariate_normal
4. 自定义与经验分布
当理论分布不适用时,可用数据构建经验分布。
-
核密度估计(KDE):从样本数据估计连续概率密度。
使用:scipy.stats.gaussian_kde -
经验分布函数(ECDF):基于样本的累积分布。
可通过numpy排序后构造
基本上就这些。根据数据特征选择合适分布,是建模和统计推断的基础。Python通过scipy.stats提供了统一接口:支持概率密度(pdf)、累积分布(cdf)、生成随机数(rvs)等功能,使用方便。










