Doob‘s Maximal Inequality

OST、MCT、UI 都是关于 $X_T$ 或 $X_\infty$ 的——也就是某个特定时刻的值。Doob’s Maximal Inequality 回答一个不同的问题：

过程在一段时间内的最大值有多大？

也就是控制 $\max_{0 \leq t \leq n} |X_t|$ 这个量。

Doob’s Maximal Inequalities的物理意义可以用极其霸道的一句话来概括：“用过程终点的能量，死死拿捏住整个历史轨迹的最高峰。”

在常规的随机过程中，你想知道一段路径的最大值（比如股票在这一年内的最高价），你必须掌握它每一天的联合概率分布，这几乎是不可能计算的。但 Doob 证明了，只要这个过程是鞅（没有系统性趋势），你只需要看最后一天的状态，就能推断出历史最高点绝对不会失控。

1. $L^1$ Version：超级进化版的马尔可夫不等式

公式：$\mathbb{P}\left(\max_{0\le t\le n}|X_t|\ge a\right) \le \frac{\mathbb{E}[|X_n|]}{a}$

回顾经典： 在基础概率论中，经典的马尔可夫不等式是 $\mathbb{P}(|X_n| \ge a) \le \frac{\mathbb{E}[|X_n|]}{a}$。它只能用来评估时刻 $n$ 这一个孤立点出现极端大值的概率。马尔可夫不等式的核心逻辑：一个非负的群体，如果平均值被固定了，那么极高值出现的比例就被严格封顶了。
Doob 的魔法： 你仔细看 Doob 不等式的左边，它把孤立的 $|X_n|$ 换成了 $\max_{0\le t\le n}|X_t|$（即从 0 到 $n$ 这整段历史路径中的最大值）。
物理意义： 即使我让你在时间长河中任意挑选最高的一个浪头（$\max$），这个浪头超过警戒线 $a$ 的概率，依然被时刻 $n$ 最终的平均能量 $\mathbb{E}[|X_n|]$ 给牢牢封顶了。

2. $L^p$ Version：放大惩罚后的全面压制 (通常取 $p=2$)

公式：$\mathbb{E}\left[\max_{0\le t\le n}|X_t|^p\right] \le \left(\frac{p}{p-1}\right)^p\mathbb{E}[|X_n|^p]$

$L^1$ 版本只给出了超过阈值的“概率上限”，而 $L^p$ 版本直接给出了整个历史最大值本身的期望上限。
代入 $p=2$（最常用的情况）： 公式变为：$\mathbb{E}\left[\max_{0\le t\le n}|X_t|^2\right] \le 4 \cdot \mathbb{E}[|X_n|^2]$
物理意义： 这是一个极其漂亮且惊人的结论。它告诉你，在任意一个公平赌局中，无论你玩多少把，你**“历史最高资产（或最大负债）的平方期望”，最多也就是你“离场时最终资产平方期望”的 4 倍**。历史最高点绝不可能脱离最终状态的引力独自升天。

3. Common Consequence：打通 UI 与最终收敛的桥梁

公式：If $\sup_n \mathbb{E}[|X_n|^2]<\infty$, then $\mathbb{E}\left[\sup_{n\ge 0}|X_n|^2\right]<\infty$.

这段话把 Doob 不等式和我们刚才讲过的 $L^2$ 有界性与 Uniform Integrability (UI) 完美闭环了。

问题:“难道 $L^2$ 有界不能阻止那个逃逸到无穷的反例吗？”

Doob 给出了终极裁判：如果一个鞅满足 $\sup_n \mathbb{E}[|X_n|^2]<\infty$（即最终状态的二阶矩是有界的），那么根据 $L^p$ 不等式（把 $n$ 推到无穷大），它整条无限长路径的全局最高点 $\sup_{n\ge 0}|X_n|^2$，其期望也是有限的！
结论： 既然连它一辈子能达到的最高点都被常数压住了，它怎么可能像之前那个反例一样“越变越窄、越变越高”逃逸到无穷远呢？所以，$L^2$ 有界直接宣判了整条路径的最高点被全局锁定，从而完美保证了 UI，保证了期望的绝对守恒。

回顾与理解Markov不等式

马尔可夫不等式（Markov’s Inequality）是整个概率论中最底层、最基础的边界估计定理。无论是切比雪夫不等式（Chebyshev）、大数定律（LLN），还是我们刚才讲的杜布最大值不等式（Doob’s Maximal Inequality），全都是在它的基础上“加装备”进化出来的。

我们先抛开公式，用一个极其现实的例子来理解它的本质。

1. 直觉理解：马尔可夫不等式在算什么？

假设你在一家公司，老板告诉你：“我们公司的平均月薪是 1 万块。”（这是你唯一的已知信息，且工资不能是负数）。

现在我问你：这家公司里，月薪超过 10 万块的高管，最多能占公司总人数的百分之几？

你可能不知道具体的工资分布，但你可以进行极端的“反证”推理：如果高管比例超过了 10%（比如 11%），就算剩下的 89% 的普通员工一分钱工资都不拿（工资为 0），单单这 11% 的高管就会把公司的平均工资拉高到：$10万 \times 11\% = 1.1万$。但这与“平均工资是 1 万块”的前提矛盾了！

所以，你立刻就能断定：月薪超过 10 万的人数比例，绝对不可能超过 10%（即 $1万 / 10万$）。

这就是马尔可夫不等式的核心逻辑：一个非负的群体，如果平均值被固定了，那么极高值出现的比例就被严格封顶了。

2. Formal Statement (正式数学定义)

Let $X$ be a non-negative random variable ($X \ge 0$ almost surely), and let $a > 0$ be any positive constant. Then:

$$\mathbb{P}(X \ge a) \le \frac{\mathbb{E}[X]}{a}$$

符号对应刚才的例子：

$X$：员工的工资（非负数，不能欠公司钱）。
$\mathbb{E}[X]$：平均工资（1 万）。
$a$：你设定的极端高薪阈值（10 万）。
$\mathbb{P}(X \ge a)$：拿到极端高薪的概率（或者说人数比例），它必然小于等于 $\frac{1万}{10万} = 10\%$。

3. 证明

它的证明只需要用到极其简单的逻辑（指示函数）。

对于任何非负随机变量 $X$ 和正数 $a$，我们可以把 $X$ 的取值分为两截：

当 $X < a$ 时，$X \ge 0$。
当 $X \ge a$ 时，$X \ge a$。

我们引入指示函数 $\mathbf{1}_{(X \ge a)}$（当事件发生时为 1，否则为 0）。那么在任何情况下，下面这个不等式都绝对成立：

$$X \ge a \cdot \mathbf{1}_{(X \ge a)}$$

(解释：如果 $X$ 比 $a$ 小，右边是 0，左边非负，成立；如果 $X$ 比 $a$ 大，右边是 $a$，左边是 $X$，依然成立。)

对不等式两边同时取数学期望（因为期望保持不等号方向）：

$$\mathbb{E}[X] \ge \mathbb{E}[a \cdot \mathbf{1}_{(X \ge a)}]$$

因为 $a$ 是常数，可以直接提出来，而指示函数的期望就等于事件发生的概率：

$$\mathbb{E}[X] \ge a \cdot \mathbb{P}(X \ge a)$$

把 $a$ 除过去，证明结束：

$$\mathbb{P}(X \ge a) \le \frac{\mathbb{E}[X]}{a}$$

4. 它的优缺点与 Doob 的联系

优点（极其霸道）： 它要求的信息极少。只要变量是非负的，并且你知道它的均值，你就能瞬间给出一个合法的上限。
缺点（极其粗糙）： 这个上限通常非常“松（Loose）”。比如在正态分布里，其实远远达不到这个上限，马尔可夫给的是一个最极端的“理论死角”。

回到 Doob’s $L^1$ Inequality：

$$\mathbb{P}\left(\max_{0\le t\le n}|X_t|\ge a\right) \le \frac{\mathbb{E}[|X_n|]}{a}$$

你看懂了马尔可夫，再看 Doob 的这个式子，就会发现它其实就是把马尔可夫不等式套在了“历史最大值” $\max |X_t|$ 这个非负随机变量上。 Doob 的神来之笔在于，他证明了 $\mathbb{E}[\max |X_t|]$ 这个极难计算的“整个路径最大值的期望”，可以被“终点状态的期望” $\mathbb{E}[|X_n|]$ 给盖住（对于子鞅来说）。

Doob‘s Maximal Inequality#

1. $L^1$ Version：超级进化版的马尔可夫不等式#

2. $L^p$ Version：放大惩罚后的全面压制 (通常取 $p=2$)#

3. Common Consequence：打通 UI 与最终收敛的桥梁#

回顾与理解Markov不等式#

1. 直觉理解：马尔可夫不等式在算什么？#

2. Formal Statement (正式数学定义)#

3. 证明#

4. 它的优缺点与 Doob 的联系#