Probability Theory I 常用概率分布

本文档整理概率论中常用的概率分布，包括离散分布和连续分布的定义、性质和应用。

上一篇：期望与积分理论

一、离散分布

1.1 伯努利分布 (Bernoulli Distribution)

定义参数为 $p \in (0,1)$ 的伯努利分布定义为：

\[\mathbb{P}[X=1] = p, \quad \mathbb{P}[X=0] = 1-p\]

期望与方差：

$\mathbb{E}[X] = p$
$\operatorname{Var}(X) = p(1-p)$

特征函数：$f(t) = (1-p) + pe^{it}$

应用：抛硬币、二值决策、成功/失败模型

1.2 泊松分布 (Poisson Distribution)

定义参数为 $\lambda > 0$ 的泊松分布：

\[\mathbb{P}[X=k] = \frac{\lambda^k}{k\!}e^{-\lambda}, \quad k=0,1,2,\ldots\]

期望与方差：

$\mathbb{E}[X] = \lambda$
$\operatorname{Var}(X) = \lambda$

特征函数：$f(t) = \exp(\lambda(e^{it}-1))$

性质：

泊松分布的可加性：若 $X \sim \text{Poisson}(\lambda_1)$，$Y \sim \text{Poisson}(\lambda_2)$ 独立，则 $X+Y \sim \text{Poisson}(\lambda_1+\lambda_2)$
当 $n \to \infty$, $p \to 0$ 且 $np \to \lambda$ 时，二项分布 $\text{Bin}(n,p)$ 收敛到泊松分布

应用：稀有事件计数、电话呼叫到达、放射性衰变

1.3 几何分布 (Geometric Distribution)

定义成功概率为 $p \in (0,1)$，第 $k$ 次首次成功的几何分布：

\[\mathbb{P}[X=k] = p(1-p)^{k-1}, \quad k=1,2,\ldots\]

期望与方差：

$\mathbb{E}[X] = \frac{1}{p}$
$\operatorname{Var}(X) = \frac{1-p}{p^2}$

特征函数：$f(t) = \frac{pe^{it}}{1-(1-p)e^{it}}$

性质：无记忆性 —— $\mathbb{P}[X > m+n | X > m] = \mathbb{P}[X > n]$

应用：等待时间、重复试验直到成功

二、连续分布

2.1 指数分布 (Exponential Distribution)

定义参数为 $\lambda > 0$ 的指数分布：

\[\mathbb{P}[X \le x] = \begin{cases}0, & x \le 0,\\ 1-e^{-\lambda x}, & x \ge 0.\end{cases}\]

密度函数：

\[p(x) = \begin{cases}0, & x \le 0, \\ \lambda e^{-\lambda x}, & x \ge 0. \end{cases}\]

期望与方差：

$\mathbb{E}[X] = \frac{1}{\lambda}$
$\operatorname{Var}(X) = \frac{1}{\lambda^2}$

特征函数：$f(t) = \frac{\lambda}{\lambda - it}$

联合分布：$n$ 个参数为 $\lambda > 0$ 的指数分布随机变量之和：

\[p(x) = \frac{\lambda^n}{\Gamma(n)} x^{n-1} e^{-\lambda x}\mathbb{1}\_{x \ge 0}\]

这是伽马分布 $\Gamma(n, \lambda)$。

性质：无记忆性 —— $\mathbb{P}[X > s+t | X > s] = \mathbb{P}[X > t]$

应用：等待时间、寿命分析、泊松过程的到达间隔

2.2 均匀分布 (Uniform Distribution)

定义区间 $[a,b]$ 上的均匀分布：

\[p(x) = \begin{cases}\frac{1}{b-a}, & a \le x \le b,\\ 0, & \text{其他}.\end{cases}\]

期望与方差：

$\mathbb{E}[X] = \frac{a+b}{2}$
$\operatorname{Var}(X) = \frac{(b-a)^2}{12}$

特征函数（区间 $[-a,a]$）：$f(t) = \frac{\sin(at)}{at}$

应用：随机抽样、数值模拟、先验分布

2.3 正态分布 (Normal Distribution)

定义标准正态分布 $\mathcal{N}(0,1)$ 的密度函数：

\[p(x) = \frac{1}{\sqrt{2\pi}}\exp\left(-\frac{x^2}{2}\right)\]

一般形式 $\mathcal{N}(m, \sigma^2)$ 的密度函数：

\[p(x) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{(x-m)^2}{2\sigma^2}\right)\]

期望与方差（标准正态）：

$\mathbb{E}[X] = 0$
$\operatorname{Var}(X) = 1$

矩（标准正态）：

$\mathbb{E}[X^{2n}] = (2n-1)!! = (2n-1)(2n-3)\cdots 3 \cdot 1$
$\mathbb{E}[X^{2n-1}] = 0$

特征函数（$\mathcal{N}(m, \sigma^2)$）：$f(t) = \exp(imt - \frac{\sigma^2 t^2}{2})$

性质：

可加性：独立正态随机变量之和仍是正态的
对称性：密度函数关于均值对称
中心极限定理的极限分布

应用：自然现象建模、误差分析、统计推断

三、分布性质总结表

分布	参数	期望	方差	特征函数
伯努利	$p$	$p$	$p(1-p)$	$(1-p)+pe^{it}$
泊松	$\lambda$	$\lambda$	$\lambda$	$\exp(\lambda(e^{it}-1))$
几何	$p$	$1/p$	$(1-p)/p^2$	$pe^{it}/(1-(1-p)e^{it})$
指数	$\lambda$	$1/\lambda$	$1/\lambda^2$	$\lambda/(\lambda-it)$
均匀$[a,b]$	$a,b$	$(a+b)/2$	$(b-a)^2/12$	$(e^{itb}-e^{ita})/(it(b-a))$
正态$\mathcal{N}(m,\sigma^2)$	$m,\sigma^2$	$m$	$\sigma^2$	$\exp(imt-\sigma^2 t^2/2)$

四、分布之间的关系图

                     伯努利分布
                         │
                         │ 重复n次独立试验
                         ▼
                   二项分布 Bin(n,p)
                         │
                         │ n→∞, p→0, np→λ
                         ▼
                   泊松分布 Poisson(λ)

                     指数分布 Exp(λ)
                         │
                         │ n个独立之和
                         ▼
              伽马分布 Γ(n, λ)

                  正态分布族
                         │
                         │ 独立和
                         ▼
                 正态分布保持不变

五、重要性质对比

无记忆性分布

具有无记忆性的分布只有：

几何分布（离散）
指数分布（连续）

无记忆性：$\mathbb{P}[X > s+t | X > s] = \mathbb{P}[X > t]$

可加性分布

独立和保持同类型分布：

泊松分布：$\text{Poisson}(\lambda_1) + \text{Poisson}(\lambda_2) = \text{Poisson}(\lambda_1+\lambda_2)$
正态分布：$\mathcal{N}(\mu_1, \sigma_1^2) + \mathcal{N}(\mu_2, \sigma_2^2) = \mathcal{N}(\mu_1+\mu_2, \sigma_1^2+\sigma_2^2)$
伽马分布（相同尺度参数）：$\Gamma(r_1, \lambda) + \Gamma(r_2, \lambda) = \Gamma(r_1+r_2, \lambda)$

六、极限关系

二项分布 → 泊松分布：$\text{Bin}(n, \lambda/n) \xrightarrow[n\to\infty]{} \text{Poisson}(\lambda)$
二项分布 → 正态分布（De Moivre-Laplace）：$\text{Bin}(n,p) \xrightarrow[n\to\infty]{} \mathcal{N}(np, np(1-p))$
泊松分布 → 正态分布（大参数）：$\text{Poisson}(\lambda) \xrightarrow[\lambda\to\infty]{} \mathcal{N}(\lambda, \lambda)$

七、实际应用指南

场景	推荐分布	理由
二值结果	伯努利	最简单的离散分布
稀有事件计数	泊松	稀有事件的极限模型
等待时间	指数/几何	无记忆性
自然现象	正态	中心极限定理
均匀随机抽样	均匀	最大熵原则
寿命/可靠性	伽马/韦布尔	灵活的形状参数

下一篇：收敛理论

Written on January 10, 2026