Probability Theory I 鞅论专题

本文档整理鞅论的核心内容，包括鞅的定义、性质、收敛定理、可选停时定理以及相关的极大不等式。

上一篇：大数定律专题

一、鞅的基本概念

1.1 鞅 (Martingale)

定义适应过程 ${X_n, \mathcal{F}_n}$ 称为鞅，如果

$\mathbb{E}[|X_n|] < \infty$ 对所有 $n$（可积性）
$X_n$ 是 $\mathcal{F}_n$ 可测的（适应性）
$\mathbb{E}[X_{n+1}|\mathcal{F}_n] = X_n$ 几乎必然（鞅性质）

直观理解：鞅是”公平博弈”的数学模型，即在给定当前信息的条件下，下一时刻的期望值等于当前值。

1.2 上鞅 (Supermartingale)

定义适应过程 ${X_n, \mathcal{F}_n}$ 称为上鞅，如果

$\mathbb{E}[|X_n|] < \infty$ 对所有 $n$
$X_n$ 是 $\mathcal{F}_n$ 可测的
$\mathbb{E}[X_{n+1}|\mathcal{F}_n] \le X_n$ 几乎必然

直观理解：上鞅对应”不利博弈”，未来期望不超过当前值。

1.3 下鞅 (Submartingale)

定义适应过程 ${X_n, \mathcal{F}_n}$ 称为下鞅，如果

$\mathbb{E}[|X_n|] < \infty$ 对所有 $n$
$X_n$ 是 $\mathcal{F}_n$ 可测的
$\mathbb{E}[X_{n+1}|\mathcal{F}_n] \ge X_n$ 几乎必然

直观理解：下鞅对应”有利博弈”，未来期望不低于当前值。

1.4 关系

\[\begin{aligned} \{X_n\} \text{ 是鞅} &\iff \{X_n\} \text{ 既是上鞅又是下鞅} \\ \{X_n\} \text{ 是下鞅} &\iff \{-X_n\} \text{ 是上鞅} \\ \{X_n\} \text{ 是上鞅} &\iff \{X_n + c\} \text{ 是鞅（适当条件下）} \end{aligned}\]

二、条件期望的性质

2.1 绝对值不等式

定理 $\mathbb{E}[X|\mathcal{A}] \le \mathbb{E}[Y|\mathcal{A}]$ a.s. 当且仅当 $\mathbb{E}[X\mathbb{1}_A] \le \mathbb{E}[Y\mathbb{1}_A]$ 对所有 $A \in \mathcal{A}$ 成立。

推论：若 $Z = \mathbb{E}[X|\mathcal{A}]$，则

$\mathbb{E}[Z] = \mathbb{E}[X]$
$|Z| \le \mathbb{E}[|X||\mathcal{A}]$ a.s.
$\mathbb{E}[|Z|] \le \mathbb{E}[|X|]$
$\mathbb{E}[|Z|\mathbb{1}_A] \le \mathbb{E}[|X|\mathbb{1}_A]$ 对所有 $A \in \mathcal{A}$ 成立

2.2 詹森不等式（条件期望版本）

定理设 $\varphi$ 为凸函数且 $\mathbb{E}[|\varphi(X)|] < \infty$，则

\[\mathbb{E}[\varphi(X)\|\mathcal{A}] \ge \varphi(\mathbb{E}[X\|\mathcal{A}])\]

应用：

取 $\varphi(x) = |x|$ 得 $|\mathbb{E}[X|\mathcal{A}]| \le \mathbb{E}[|X||\mathcal{A}]$
取 $\varphi(x) = x^2$ 得 $\mathbb{E}[X|\mathcal{A}]^2 \le \mathbb{E}[X^2|\mathcal{A}]$

三、Doob 极大不等式

Doob 极大不等式是鞅论中的重要工具，用于控制鞅的极大值。

3.1 基本形式

定理设 ${X_n}$ 为非负下鞅。定义 $X_n^* = \max_{k \le n} X_k$。则

\[\lambda \mathbb{P}(X_n^* \ge \lambda) \le \mathbb{E}[X_n \mathbb{1}\_{X_n^* \ge \lambda}] \le \mathbb{E}[X_n]\]

证明思路：定义停时 $T = \min {n | X_n \ge \lambda}$。注意到 $X_n^* \ge \lambda = {T \le n}$。

\[\begin{aligned} \mathbb{E}[X_n \mathbb{1}\_{T \le n}] &= \sum_{j=1}^n \mathbb{E}[X_n \mathbb{1}\_{T=j}] \\ &\ge \sum_{j=1}^n \mathbb{E}[X_j \mathbb{1}\_{T=j}] \quad \text{(下鞅性质)} \\ &\ge \sum_{j=1}^n \lambda \mathbb{P}(T=j) = \lambda \mathbb{P}(T \le n) \end{aligned}\]

3.2 $L^p$ 版本

定理设 ${X_n}$ 为非负下鞅。则对所有 $p > 1$ 有

\[\|X_n^*\|_p \le \frac{p}{p-1}\|X_n\|_p\]

意义：这是鞅论中的 Doob 不等式，与 Kolmogorov 不等式在形式上相似，但适用于更一般的下鞅。

四、鞅的收敛性

鞅收敛定理是鞅论的核心结果，给出了鞅在几乎必然和 $L^p$ 意义下的收敛条件。

4.1 几乎必然收敛

定理设 ${X_n}$ 为上鞅，在 $L^1$ 中有界，即 $\sup_n \mathbb{E}[|X_j|] < \infty$

则 $X_n \to X_\infty \in L^1$ a.s.

推论：若 ${X_n}$ 为非负上鞅，则 $X_n \to X_\infty \in L^1$ a.s.

4.2 $L^p$ 收敛

定理设 ${X_n}$ 为鞅，$p > 1$。以下等价：

${X_n}$ 在 $L^p$ 中有界
${X_n}$ 几乎必然且 $L^p$ 收敛到 $X_\infty \in L^p$
存在 $Z \in L^p$ 使得 $X_n = \mathbb{E}[Z|\mathcal{F}_n]$ a.s. $\forall n$

意义：对于 $p > 1$，鞅的 $L^p$ 有界性蕴含几乎必然和 $L^p$ 收敛。

4.3 $L^1$ 收敛

定理设 ${X_n}$ 为鞅，以下等价：

${X_n}$ 是 UI 的（一致可积）
${X_n} \to X_\infty$ 在 $L^1$ 中且几乎必然收敛
存在 $X_\infty \in L^1$ 使得 $X_n = \mathbb{E}[X_\infty|\mathcal{F}_n]$ a.s. $\forall n$

引理：设 $\mathcal{F}$ 为 $\sigma$-代数，$X \in L^1$，则 ${\mathbb{E}[X|\mathcal{A}]: \mathcal{A} \text{ 是 } \mathcal{F} \text{ 的子 } \sigma\text{-代数}}$ 是 UI 的。

证明要点： $\begin{aligned} \mathbb{E}[\|\mathbb{E}[X\|\mathcal{A}]\|\mathbb{1}_{\|\mathbb{E}[X\|\mathcal{A}]\|>\epsilon}] &\le \mathbb{E}[\|X\|\mathbb{1}_{\|\mathbb{E}[X\|\mathcal{A}]\|>\epsilon}] \\ &= \mathbb{E}[\|X\|\mathbb{1}_{\|X\|>\delta}\mathbb{1}_{\|\mathbb{E}[X\|\mathcal{A}]\|>\epsilon}] + \mathbb{E}[\|X\|\mathbb{1}_{\|X\|\le\delta}\mathbb{1}_{\|\mathbb{E}[X\|\mathcal{A}]\|>\epsilon}] \\ &\le \mathbb{E}[\|X\|\mathbb{1}_{\|X\|>\delta}] + \delta \mathbb{P}(\|\mathbb{E}[X\|\mathcal{A}]\|>\epsilon) \\ &\le \mathbb{E}[\|X\|\mathbb{1}_{\|X\|>\delta}] + \frac{\delta}{\epsilon}\mathbb{E}[\|X\|] \end{aligned}$

令 $\delta \to \infty$，$\epsilon = \delta^2$。

推论：设 $X \in L^1$，则 $\mathbb{E}[X|\mathcal{F}_n] \to \mathbb{E}[X|\mathcal{F}_\infty]$ 在几乎必然且 $L^1$ 意义下成立。

其中 $\mathcal{F}_\infty = \sigma(\bigcup_n \mathcal{F}_n)$。

五、可选停时定理

可选停时定理（也称为可选抽样定理）是鞅论的重要应用工具。

5.1 鞅情形

定理设 ${X_n}$ 为鞅，$T$ 为停时。

$X_{n \wedge T}$ 是鞅，因此 $\mathbb{E}[X_{n \wedge T}] = \mathbb{E}[X_0]$
若 $T$ 有界（不超过 $N$），则 $\mathbb{E}[X_T] = \mathbb{E}[X_0]$ 且当 $T \ge S$ a.s. 时有 $\mathbb{E}[X_T|\mathcal{F}_S] = X_S$ a.s.
若 $T < \infty$ a.s. 且 $|X_n| \le Y \in L^1$，则 $\mathbb{E}[X_T] = \mathbb{E}[X_0]$
若 $\mathbb{E}[T] < \infty$，且 $X_n$ 有有界增量，则 $\mathbb{E}[X_T] = \mathbb{E}[X_0]$

5.2 上鞅情形

定理设 ${X_n}$ 为上鞅，$T$ 为停时。

$X_{n \wedge T}$ 是上鞅，因此 $\mathbb{E}[X_{n \wedge T}] \le \mathbb{E}[X_0]$
若 $T$ 有界，则 $\mathbb{E}[X_T] \le \mathbb{E}[X_0]$ 且当 $T \ge S$ a.s. 时有 $\mathbb{E}[X_T|\mathcal{F}_S] \le X_S$ a.s.
若 $T < \infty$ a.s. 且 $|X_n| \le Y \in L^1$，则 $\mathbb{E}[X_T] \le \mathbb{E}[X_0]$
若 $\mathbb{E}[T] < \infty$，且 $X_n$ 有有界增量，则 $\mathbb{E}[X_T] \le \mathbb{E}[X_0]$
若 $T < \infty$ a.s.，且 ${X_n}$ 非负，则 $\mathbb{E}[X_T] \le \mathbb{E}[X_0]$

5.3 UI 鞅情形

定理设 ${X_n}$ 为 UI 鞅。$S \le T$ 为停时，则

\[\mathbb{E}[X_T \| \mathcal{F}\_S] = X_S \quad \text{a.s.}\]

因此 $\mathbb{E}[X_T] = \mathbb{E}[X_S]$。

意义：对于 UI 鞅，可选停时定理在最一般的条件下成立。

六、Kolmogorov 0-1 律

定理设 ${\xi_i}_{i \ge 1}$ 为独立随机变量序列。设 $\mathcal{G}_n = \sigma(\xi_k, k \ge n)$ 且 $\mathcal{G}_\infty = \cap_{n \ge 1} \mathcal{G}_n$。则 $\mathcal{G}_\infty$ 是平凡的，即对任意 $A \in \mathcal{G}_\infty$ 有 $\mathbb{P}(A) = 0$ 或 $1$。

直观理解：尾部 $\sigma$-代数中的事件概率只能是 0 或 1，这些事件不受任何有限个随机变量的影响。

应用：用于证明独立随机变量序列的某些极限性质几乎必然成立或不成立。

七、鞅论理论体系图

                    条件期望
                        │
        ┌───────────────┼───────────────┐
        ▼               ▼               ▼
      鞅定义          Doob极大不等式    停时理论
        │               │               │
        ▼               ▼               ▼
    鞅的性质          极大值控制      可选停时定理
        │               │               │
        └───────┬───────┴───────────────┘
                ▼
            鞅收敛定理
                │
        ┌───────┼───────┐
        ▼       ▼       ▼
     a.s.收敛  L^p收敛  L^1收敛
    (L^1有界) (L^p有界)  (UI条件)

八、重要定理关系

定理	条件	结论类型	应用场景
Doob 极大不等式	非负下鞅	尾概率估计	控制鞅的极大值
Doob 不等式 ($L^p$)	下鞅，$p>1$	$L^p$ 范数估计	$L^p$ 鞅的收敛性
鞅收敛定理 (a.s.)	$L^1$ 有界上鞅	a.s. 收敛	上鞅的极限行为
鞅收敛定理 ($L^p$)	$L^p$ 有界鞅	a.s. + $L^p$ 收敛	高阶矩鞅的收敛
鞅收敛定理 ($L^1$)	UI 鞅	a.s. + $L^1$ 收敛	一般鞅的收敛
可选停时定理	各种条件	期望保持	停时问题的期望计算

九、鞅收敛定理对比

收敛类型	充要条件	极限表示	典型应用
几乎必然	$L^1$ 有界（上鞅）	$X_\infty \in L^1$	上鞅的稳定性
$L^p$ ($p>1$)	$L^p$ 有界	$X_n = \mathbb{E}[Z\|\mathcal{F}_n]$	条件期望的正则性
$L^1$	UI	$X_n = \mathbb{E}[X_\infty\|\mathcal{F}_n]$	一致可积鞅的收敛

十、经典鞅例子

10.1 例1：鞅差序列和

设 ${Y_n}$ 是独立同分布，$\mathbb{E}[Y_n] = 0$，$\mathbb{E}[|Y_n|] < \infty$。定义 $X_n = \sum_{j=1}^n Y_j$，则 ${X_n}$ 是鞅。

10.2 例2：似然比

设 ${Y_n}$ 是独立同分布，$\mathbb{E}[Y_n] = 1$。定义 $X_n = \prod_{j=1}^n Y_j$，则 ${X_n}$ 是鞅。

10.3 例3：Doob 鞅

设 $Z \in L^1$，定义 $X_n = \mathbb{E}[Z|\mathcal{F}_n]$，则 ${X_n}$ 是 UI 鞅，且 $X_n \to \mathbb{E}[Z|\mathcal{F}_\infty]$ a.s. 且 $L^1$。

10.4 例4：Polya 罐子模型

初始有 $a$ 个红球和 $b$ 个蓝球。每次随机取一个球，然后放回并增加同色球 $c$ 个。设 $X_n$ 为第 $n$ 次红球比例，则 ${X_n}$ 是鞅。

十一、应用指南

11.1 判定鞅类型

检查项	鞅	上鞅	下鞅
可积性	✓	✓	✓
适应性	✓	✓	✓
条件期望	$E[X_{n+1}\|\mathcal{F}_n] = X_n$	$E[X_{n+1}\|\mathcal{F}_n] \le X_n$	$E[X_{n+1}\|\mathcal{F}_n] \ge X_n$

11.2 证明收敛性

目标	推荐定理	关键条件
a.s. 收敛（上鞅）	Doob 收敛定理	$L^1$ 有界
$L^p$ 收敛 ($p>1$)	Doob $L^p$ 收敛定理	$L^p$ 有界
$L^1$ 收敛	UI 鞅收敛定理	一致可积
期望计算	可选停时定理	验证对应条件

11.3 常用技巧

构造鞅：从条件期望定义出发，验证鞅性质
停时分析：利用可选停时定理简化期望计算
极大值估计：使用 Doob 极大不等式
收敛性：验证 UI 条件或 $L^p$ 有界性

十二、重要提示

鞅的核心意义：鞅是”公平博弈”的数学模型，鞅论提供了研究随机过程收敛性的强大工具。
UI 的重要性：一致可积性是连接依概率收敛和 $L^1$ 收敛的桥梁，在鞅收敛定理中起关键作用。
停时的灵活性：可选停时定理允许我们选择适当的停时来简化问题，这是鞅论的重要应用。
收敛条件对比：
- $p > 1$：$L^p$ 有界即可
- $p = 1$：需要更强的 UI 条件
- a.s. 收敛：只需 $L^1$ 有界（对上鞅）

下一篇：中心极限定理专题

Written on January 10, 2026