Doob‘s Maximal Inequality

OST、MCT、UI 都是关于 $X_T$ 或 $X_\infty$ 的——也就是某个特定时刻的值。Doob’s Maximal Inequality 回答一个不同的问题:

过程在一段时间内的最大值有多大?

也就是控制 $\max_{0 \leq t \leq n} |X_t|$ 这个量。

Doob’s Maximal Inequalities的物理意义可以用极其霸道的一句话来概括:“用过程终点的能量,死死拿捏住整个历史轨迹的最高峰。”

在常规的随机过程中,你想知道一段路径的最大值(比如股票在这一年内的最高价),你必须掌握它每一天的联合概率分布,这几乎是不可能计算的。但 Doob 证明了,只要这个过程是鞅(没有系统性趋势),你只需要看最后一天的状态,就能推断出历史最高点绝对不会失控。

1. $L^1$ Version:超级进化版的马尔可夫不等式

公式:$\mathbb{P}\left(\max_{0\le t\le n}|X_t|\ge a\right) \le \frac{\mathbb{E}[|X_n|]}{a}$

  • 回顾经典: 在基础概率论中,经典的马尔可夫不等式是 $\mathbb{P}(|X_n| \ge a) \le \frac{\mathbb{E}[|X_n|]}{a}$。它只能用来评估时刻 $n$ 这一个孤立点出现极端大值的概率。马尔可夫不等式的核心逻辑:一个非负的群体,如果平均值被固定了,那么极高值出现的比例就被严格封顶了。
  • Doob 的魔法: 你仔细看 Doob 不等式的左边,它把孤立的 $|X_n|$ 换成了 $\max_{0\le t\le n}|X_t|$(即从 0 到 $n$ 这整段历史路径中的最大值)。
  • 物理意义: 即使我让你在时间长河中任意挑选最高的一个浪头($\max$),这个浪头超过警戒线 $a$ 的概率,依然被时刻 $n$ 最终的平均能量 $\mathbb{E}[|X_n|]$ 给牢牢封顶了。

2. $L^p$ Version:放大惩罚后的全面压制 (通常取 $p=2$)

公式:$\mathbb{E}\left[\max_{0\le t\le n}|X_t|^p\right] \le \left(\frac{p}{p-1}\right)^p\mathbb{E}[|X_n|^p]$

  • $L^1$ 版本只给出了超过阈值的“概率上限”,而 $L^p$ 版本直接给出了整个历史最大值本身的期望上限
  • 代入 $p=2$(最常用的情况): 公式变为:$\mathbb{E}\left[\max_{0\le t\le n}|X_t|^2\right] \le 4 \cdot \mathbb{E}[|X_n|^2]$
  • 物理意义: 这是一个极其漂亮且惊人的结论。它告诉你,在任意一个公平赌局中,无论你玩多少把,你**“历史最高资产(或最大负债)的平方期望”,最多也就是你“离场时最终资产平方期望”的 4 倍**。历史最高点绝不可能脱离最终状态的引力独自升天。

3. Common Consequence:打通 UI 与最终收敛的桥梁

公式:If $\sup_n \mathbb{E}[|X_n|^2]<\infty$, then $\mathbb{E}\left[\sup_{n\ge 0}|X_n|^2\right]<\infty$.

这段话把 Doob 不等式和我们刚才讲过的 $L^2$ 有界性与 Uniform Integrability (UI) 完美闭环了。

问题:“难道 $L^2$ 有界不能阻止那个逃逸到无穷的反例吗?”

  • Doob 给出了终极裁判:如果一个鞅满足 $\sup_n \mathbb{E}[|X_n|^2]<\infty$(即最终状态的二阶矩是有界的),那么根据 $L^p$ 不等式(把 $n$ 推到无穷大),它整条无限长路径的全局最高点 $\sup_{n\ge 0}|X_n|^2$,其期望也是有限的!
  • 结论: 既然连它一辈子能达到的最高点都被常数压住了,它怎么可能像之前那个反例一样“越变越窄、越变越高”逃逸到无穷远呢?所以,$L^2$ 有界直接宣判了整条路径的最高点被全局锁定,从而完美保证了 UI,保证了期望的绝对守恒。

回顾与理解Markov不等式

马尔可夫不等式(Markov’s Inequality)是整个概率论中最底层、最基础的边界估计定理。无论是切比雪夫不等式(Chebyshev)、大数定律(LLN),还是我们刚才讲的杜布最大值不等式(Doob’s Maximal Inequality),全都是在它的基础上“加装备”进化出来的。

我们先抛开公式,用一个极其现实的例子来理解它的本质。

1. 直觉理解:马尔可夫不等式在算什么?

假设你在一家公司,老板告诉你:“我们公司的平均月薪是 1 万块。”(这是你唯一的已知信息,且工资不能是负数)。

现在我问你:这家公司里,月薪超过 10 万块的高管,最多能占公司总人数的百分之几?

你可能不知道具体的工资分布,但你可以进行极端的“反证”推理: 如果高管比例超过了 10%(比如 11%),就算剩下的 89% 的普通员工一分钱工资都不拿(工资为 0),单单这 11% 的高管就会把公司的平均工资拉高到:$10万 \times 11\% = 1.1万$。 但这与“平均工资是 1 万块”的前提矛盾了!

所以,你立刻就能断定:月薪超过 10 万的人数比例,绝对不可能超过 10%(即 $1万 / 10万$)。

这就是马尔可夫不等式的核心逻辑:一个非负的群体,如果平均值被固定了,那么极高值出现的比例就被严格封顶了。


2. Formal Statement (正式数学定义)

Let $X$ be a non-negative random variable ($X \ge 0$ almost surely), and let $a > 0$ be any positive constant. Then:

$$\mathbb{P}(X \ge a) \le \frac{\mathbb{E}[X]}{a}$$

符号对应刚才的例子:

  • $X$:员工的工资(非负数,不能欠公司钱)。
  • $\mathbb{E}[X]$:平均工资(1 万)。
  • $a$:你设定的极端高薪阈值(10 万)。
  • $\mathbb{P}(X \ge a)$:拿到极端高薪的概率(或者说人数比例),它必然小于等于 $\frac{1万}{10万} = 10\%$。

3. 证明

它的证明只需要用到极其简单的逻辑(指示函数)。

对于任何非负随机变量 $X$ 和正数 $a$,我们可以把 $X$ 的取值分为两截:

  1. 当 $X < a$ 时,$X \ge 0$。
  2. 当 $X \ge a$ 时,$X \ge a$。

我们引入指示函数 $\mathbf{1}_{(X \ge a)}$(当事件发生时为 1,否则为 0)。那么在任何情况下,下面这个不等式都绝对成立:

$$X \ge a \cdot \mathbf{1}_{(X \ge a)}$$

(解释:如果 $X$ 比 $a$ 小,右边是 0,左边非负,成立;如果 $X$ 比 $a$ 大,右边是 $a$,左边是 $X$,依然成立。)

对不等式两边同时取数学期望(因为期望保持不等号方向):

$$\mathbb{E}[X] \ge \mathbb{E}[a \cdot \mathbf{1}_{(X \ge a)}]$$

因为 $a$ 是常数,可以直接提出来,而指示函数的期望就等于事件发生的概率:

$$\mathbb{E}[X] \ge a \cdot \mathbb{P}(X \ge a)$$

把 $a$ 除过去,证明结束:

$$\mathbb{P}(X \ge a) \le \frac{\mathbb{E}[X]}{a}$$

4. 它的优缺点与 Doob 的联系

  • 优点(极其霸道): 它要求的信息极少。只要变量是非负的,并且你知道它的均值,你就能瞬间给出一个合法的上限。
  • 缺点(极其粗糙): 这个上限通常非常“松(Loose)”。比如在正态分布里,其实远远达不到这个上限,马尔可夫给的是一个最极端的“理论死角”。

回到 Doob’s $L^1$ Inequality:

$$\mathbb{P}\left(\max_{0\le t\le n}|X_t|\ge a\right) \le \frac{\mathbb{E}[|X_n|]}{a}$$

你看懂了马尔可夫,再看 Doob 的这个式子,就会发现它其实就是把马尔可夫不等式套在了“历史最大值” $\max |X_t|$ 这个非负随机变量上。 Doob 的神来之笔在于,他证明了 $\mathbb{E}[\max |X_t|]$ 这个极难计算的“整个路径最大值的期望”,可以被“终点状态的期望” $\mathbb{E}[|X_n|]$ 给盖住(对于子鞅来说)。