几何分布(Geometric Distribution)是一种离散概率分布,用于描述一次次独立重复试验中,第一次成功所需的试验次数。
🔢 一、定义
在一系列独立的伯努利试验中(每次试验只有两种结果:“成功”或“失败”),设:
- 每次试验成功的概率为 p
- 失败的概率为 1−p
几何分布随机变量 X 表示第一次成功出现在哪一轮,取值为 1,2,3,…
📘 二、概率质量函数(PMF)
几何分布的概率质量函数为:P(X=k)=(1−p)k−1⋅p,k=1,2,3,…
意思是:
- 前 k−1 次试验都失败,第 k 次试验成功
✅ 举例:
如果投掷硬币直到第一次正面朝上(成功),硬币正面概率为 p=0.5,那么:P(X=3)=(1−0.5)2⋅0.5=0.25⋅0.5=0.125
📊 三、期望与方差
- 期望值(数学期望):E[X]=1p
- 方差:Var(X)=1−pp2
📈 四、分布函数(CDF)
几何分布的累计分布函数(CDF)是:P(X≤k)=1−(1−p)k
🧠 五、性质
- 记忆无关性(Memoryless)
几何分布是唯一的离散分布具有记忆无关性,即:P(X>m+n∣X>m)=P(X>n)也就是说,不管已经失败了多少次,下一次成功的概率始终不变。 - 伯努利试验模型
几何分布本质上来自重复的伯努利试验,是二项分布在“第一次成功”场景下的特例。
📌 六、实际应用场景
场景 | 几何分布解释 |
---|---|
电话客服接通成功 | 某客服拨打多少次才第一次打通 |
网络请求成功 | 网络请求重复尝试,直到第一次成功 |
工业质检 | 连续检测产品,第一次发现不合格的次数 |
游戏开箱 | 开多少次箱子才开出稀有物品 |
🔧 七、Python 示例代码
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import geom
p = 0.3 # 成功概率
x = np.arange(1, 15)
pmf = geom.pmf(x, p)
plt.bar(x, pmf)
plt.title(f'几何分布 PMF (p={p})')
plt.xlabel('X = 第几次试验成功')
plt.ylabel('P(X)')
plt.grid(True)
plt.show()
如果你还想了解 负几何分布(直到失败前成功的次数) 或几何分布与其他分布的关系,也可以告诉我。
发表回复