Brownian Motion

1. Definition

A process $(B_t)_{t\ge 0}$ is Brownian motion if:

  1. $B_0=0$
  2. It has independent increments
  3. For every $s
$$ B_t-B_s\sim N(0,t-s) $$
  1. Its sample paths are continuous almost surely

在布朗运动中,$B_t$ 可以取任意实数,即状态空间为 $(-\infty, +\infty)$。它不是一个固定的常数,而是一个随时间变化的随机变量

方差 $\mathrm{Var}(B_t) = t$:这描述的是 $B_t$ 偏离中心点(0)的程度。方差等于 $t$ 意味着随着时间增加,粒子扩散得越来越远。

根据定义的第三条性质,在任何给定的时间 $t > 0$,状态 $B_t$ 服从正态分布:

$$B_t \sim N(0, t)$$

这意味着:

  1. 理论取值:在时刻 $t$,粒子的位置可以出现在坐标轴上的任何一点。
  2. 概率分布:取值在 $0$ 附近的概率最高。随着时间 $t$ 的流逝,方差 $t$ 变大,正态分布的钟形曲线变得更宽更扁平,$B_t$ 取到绝对值较大的数(即远离原点)的概率逐渐增加。

大写的 $B$ 通常代表整个随机过程 $(B_t)_{t \ge 0}$(即所有可能的连续轨迹的集合),而我们讨论“取值”时,通常是指在特定时刻 $t$ 的随机变量 $B_t$。

从条件 2 和 3 可以推出: $(B_{t_1}, B_{t_2}, \ldots, B_{t_k})$ 是 multivariate normal(多元正态)。满足这个性质的过程叫做 Gaussian Process

Brownian Motion as a Gaussian Process

1. Definition

Theorem: Brownian Motion as a Gaussian Process A standard Brownian motion $(B_t)_{t \ge 0}$ is a Gaussian process. Its finite-dimensional distributions are completely characterized by its mean function and covariance function:

  1. Mean function: $m(t) = \mathbb{E}[B_t] = 0$
  2. Covariance function: $C(s, t) = \mathrm{Cov}(B_s, B_t) = \min(s, t)$

Explanation

高斯过程的严格定义要求其任意有限维边缘分布均为多元正态分布。对于布朗运动,给定任意时间序列 $0 < t_1 < t_2 < \dots < t_k$,可以通过其独立增量性质严格证明 $(B_{t_1}, \dots, B_{t_k})$ 服从多元正态分布。

由于增量 $B_{t_1}, B_{t_2} - B_{t_1}, \dots, B_{t_k} - B_{t_{k-1}}$ 是一组相互独立且服从一维正态分布的随机变量,而状态向量 $(B_{t_1}, \dots, B_{t_k})$ 可以表示为这些独立增量的线性变换,因此该状态向量必然服从多元正态分布。

关于协方差函数 $C(s, t) = \min(s, t)$ 的代数推导如下。假设 $0 \le s \le t$:

$$ \begin{aligned} \mathrm{Cov}(B_s, B_t) &= \mathbb{E}[(B_s - \mathbb{E}[B_s])(B_t - \mathbb{E}[B_t])] \\ &= \mathbb{E}[B_s B_t] \\ &= \mathbb{E}[B_s (B_s + B_t - B_s)] \\ &= \mathbb{E}[B_s^2 + B_s(B_t - B_s)] \\ &= \mathbb{E}[B_s^2] + \mathbb{E}[B_s(B_t - B_s)] \end{aligned} $$

根据布朗运动的独立增量性质,$B_s$(即 $B_s - B_0$)与 $B_t - B_s$ 相互独立。同时由于 $\mathbb{E}[B_t - B_s] = 0$,交叉项的期望为:

$$ \mathbb{E}[B_s(B_t - B_s)] = \mathbb{E}[B_s]\mathbb{E}[B_t - B_s] = 0 $$

根据定义,$\mathbb{E}[B_s^2] = \mathrm{Var}(B_s) = s$。因此,当 $s \le t$ 时,$\mathrm{Cov}(B_s, B_t) = s$。 基于对称性,对任意给定的 $s, t \ge 0$,该结果可以推广为 $\mathrm{Cov}(B_s, B_t) = \min(s, t)$。

因为高斯过程由其一阶矩和二阶矩完全决定,上述均值和协方差函数唯一确定了布朗运动的全部有限维分布。


从 SRW 到 Brownian Motion

1. 缩放思想 (Scaling Idea)

  • 基础模型:$X_n = \sum_{i=1}^n \varepsilon_i$ 这是一个标准的对称随机游走。想象你站在原点,每秒钟抛一次硬币($\varepsilon_i$),正面就向右走1步(+1),反面就向左走1步(-1)。
  • 时空缩放 (Time-Space Scaling):$\frac{1}{\sqrt n}X_{\lfloor nt\rfloor}$ 为了从离散走向连续,我们需要“加快脚步”并“缩小步幅”。
    • 时间加速:$\lfloor nt\rfloor$ 意味着在 $t$ 时间内,我们原本只走 $t$ 步,现在我们要走 $n \times t$ 步。当 $n$ 很大时,我们在极短的时间内走了无数步。
    • 空间压缩:$\frac{1}{\sqrt n}$ 是为了平衡时间的加速。为什么除以 $\sqrt{n}$ 而不是 $n$?因为方差是线性累加的,而标准差是平方根累加的。如果空间除以 $n$,路径最后会缩成一条直线(大数定律);只有除以 $\sqrt{n}$,随机性的波动才会被完美保留下来。

2. 极限分布 (Limiting Distribution)

  • 中心极限定理的威力: 由于 $\varepsilon_i$ 是独立同分布的,期望为0,方差为1。根据中心极限定理,大量独立随机变量的和趋向于正态分布。因此,缩放后的位置趋向于 $N(0,t)$。
  • 方差的完美契合: 每一步的方差是1。走了 $\lfloor nt\rfloor$ 步,总方差就是 $\lfloor nt\rfloor$。因为我们在空间上缩放了 $\frac{1}{\sqrt n}$,所以总方差要乘以 $(\frac{1}{\sqrt n})^2 = \frac{1}{n}$。 最终方差计算为: $$\mathrm{Var}\left(\frac{1}{\sqrt n}X_{\lfloor nt\rfloor}\right) = \frac{\lfloor nt\rfloor}{n} \to t$$ 这正好匹配了标准布朗运动 $B(t)$ 的核心性质:$B(t)$ 服从正态分布,期望为0,方差为 $t$

3. 核心意义 (Why this matters)

布朗运动不仅是一个纯粹的数学构造(连续时间、连续状态空间的马尔可夫过程),它更是所有具有有限方差的独立增量过程的“通用宏观极限”

这就像物理学中的流体:微观上是无数个水分子在做杂乱无章的碰撞(随机游走),但在宏观尺度下,只要我们把时间和空间按照 $t$ 和 $\sqrt{t}$ 的比例缩小,我们看到的将是一个连续的、具有高度分形特征的流体运动(布朗运动)。


Brownian Motion’s Properties

Theorem A: Markov Property of Brownian Motion

let $(B_t)_{t \ge 0}$ be a standard Brownian motion and let $\mathcal{F}_t = \sigma(B_s : 0 \le s \le t)$ be the natural filtration representing the history of the process up to time $t$.

For any $r > t$ and any measurable function $f$:

$$E[f(B_r) \mid \mathcal{F}_t] = E[f(B_r) \mid B_t]$$

Equivalently, the conditional distribution of $B_r$ given the entire past $\mathcal{F}_t$ depends only on the current state $B_t$.

逻辑证明 (Reasoning): 根据布朗运动的定义,其增量是独立的。 对于任何 $s > 0$,未来位置可以表示为:$B_{t+s} = B_t + (B_{t+s} - B_t)$。 由于增量 $(B_{t+s} - B_t)$ 独立于截止到 $t$ 时刻的所有历史信息 $\mathcal{F}_t$,因此给定 $B_t$ 后,历史轨迹对预测 $B_{t+s}$ 的分布没有贡献。

马尔可夫性要求时间 $t$ 必须是预先确定的。但在研究中,我们经常关注由路径本身决定的随机时间,例如“第一次到达某个水位 $a$ 的时刻”。这种时间被称为停时(Stopping Time)

Definition: Stopping Time A random variable $T: \Omega \to [0, \infty]$ is a stopping time with respect to the filtration $(\mathcal{F}_t)_{t \ge 0}$ if for every $t \ge 0$, the event $\{T \le t\} \in \mathcal{F}_t$.

Theorem B: Strong Markov Property of Brownian Motion

Let $T$ be a stopping time such that $P(T < \infty) = 1$. Then the process $\tilde{B}_s = B_{T+s} - B_T$ ($s \ge 0$) is a standard Brownian motion independent of the pre-T sigma-field $\mathcal{F}_T$.

逻辑意义: 强马尔可夫性意味着布朗运动在停时 $T$ “重新开始”了。无论 $T$ 的取值如何(只要它不预见未来),布朗运动从该随机时刻起的后续行为依然像是一个全新的、从原点出发的布朗运动。

两者的区别与联系

特性时间 $T$ 的性质描述关键用途
Markov Property确定性数值 (Deterministic)给定 $B_t$,未来独立于过去。导出转移概率密度 (Transition density)。
Strong Markov Property随机停时 (Stopping Time)在随机时刻 $T$ 重新出发,依然是 BM。证明反射原理 (Reflection Principle),计算首达时间分布。

为什么布朗运动具有强马尔可夫性? 并非所有马尔可夫过程都具有强马尔可夫性。布朗运动之所以具备此性质,是因为其路径是几乎处处连续的。这种连续性确保了在停时 $T$ 附近的极限行为是稳定的,从而允许我们将固定时间的性质推广到随机停时上。

如果没有强马尔可夫性,我们就无法通过对称性来证明反射原理(即 $P(\sup_{0\le s\le t} B_s \ge a) = 2P(B_t \ge a)$)。

Theorem C: Brownian Motion is continuous everywhere but not differentiable everywhere.

性质 C 描述了布朗运动最令人着迷且最具挑战性的几何特性:它是一条连续的“无限锯齿”

1. 连续性与不可微性的对立 (Continuity vs. Differentiability)

根据定义条件 4,布朗运动的路径样本 $t \mapsto B_t$ 是几乎处处连续 (a.s. continuous) 的。这意味着粒子不会发生瞬间的位移跳跃。

然而,连续并不意味着平滑。在普通微积分中,我们定义导数为:

$$f'(t) = \lim_{\Delta t \to 0} \frac{f(t+\Delta t) - f(t)}{\Delta t}$$

对于布朗运动,我们考察这个差分商的统计特性。

2. 方差爆炸推导 (Variance Explosion)

根据布朗运动的平稳独立增量性质:

$$B_{t+\Delta t} - B_t \sim N(0, \Delta t)$$

设差分商为 $V_{\Delta t} = \frac{B_{t+\Delta t} - B_t}{\Delta t}$。利用正态分布的缩放性质:

$$\text{Var}(V_{\Delta t}) = \text{Var}\left( \frac{1}{\Delta t} (B_{t+\Delta t} - B_t) \right) = \frac{1}{(\Delta t)^2} \text{Var}(B_{t+\Delta t} - B_t)$$

将 $\text{Var}(B_{t+\Delta t} - B_t) = \Delta t$ 代入:

$$\text{Var}(V_{\Delta t}) = \frac{\Delta t}{(\Delta t)^2} = \frac{1}{\Delta t}$$

结论: 当 $\Delta t \to 0$ 时,$\text{Var}(V_{\Delta t}) \to \infty$。 这意味着随着观测时间窗口的缩小,平均速度(斜率)的波动不仅没有趋于稳定,反而变得无穷大。因此,在任何点 $t$,极限 $\lim_{\Delta t \to 0} V_{\Delta t}$ 在概率意义上都不存在。

3. 几何直观与分形特征

布朗运动的路径具有自相似性 (Self-similarity)。如果你放大路径的任何一段,你会发现它看起来和整体一样剧烈震荡。

  • 普通平滑函数:放大后会看起来像一条直线(线性逼近)。
  • 布朗运动:无论放大多少倍,它依然是无数个细小的 V 型或柱状震荡。

这种性质在数学上由 Paley-Wiener-Zygmund Theorem 严格证明:在概率为 1 的情况下,布朗运动路径在任何点都不存在有限导数。

4. 对随机微积分的影响 (Need for Itô Calculus)

这种“处处不可微”性质导致了经典黎曼-斯蒂尔杰斯积分 (Riemann-Stieltjes integral) 的失效。 在经典微积分中,微分项 $df = f'(t)dt$。 但在布朗运动中,由于 $dB_t$ 的量级大约是 $\sqrt{dt}$(因为 $\text{Var}(dB_t) = dt$),所以:

$$(dB_t)^2 \approx dt$$

这就导致了 Itô’s Lemma 中出现了二阶导数项。如果你尝试用普通链式法则处理 $B_t^2$ 的微分,你会漏掉一个关键的常数项,因为布朗运动的二阶变差 (Quadratic Variation) 不为零。

Summary Table:

特征经典函数 (Smooth)布朗运动 (BM)
增量数量级$\Delta f \sim \Delta t$$\Delta B \sim \sqrt{\Delta t}$
差分商极限收敛于 $f'(t)$方差 $\to \infty$,不收敛
路径几何局部线性局部维数为 1.5 的分形
二阶变差$[f, f]_t = 0$$[B, B]_t = t$

Brownian Motion is Martingale

接下来的内容探讨了布朗运动在**鞅(Martingale)**理论中的地位。这是随机分析(Stochastic Analysis)的核心,也是后续研究伊藤积分(Itô Integral)的基础。

1. 命题 (Statement)

Brownian motion $(B_t)_{t\ge 0}$ is a martingale with respect to its natural filtration $(\mathcal F_t)$.

这里的 $\mathcal F_t = \sigma(B_u : 0 \le u \le t)$ 代表了到时间 $t$ 为止该过程产生的所有信息(即“历史”)。一个过程被称为鞅,通俗地说,就是它代表了一个**“公平游戏”**:给定现在的观测值,未来的期望值就等于现在的观测值。

2. 严格证明 (Verification)

For $s < t$, to show $(B_t)$ is a martingale, we must verify $\mathbb E[B_t \mid \mathcal F_s] = B_s$.

$$ \begin{aligned} \mathbb E[B_t \mid \mathcal F_s] &= \mathbb E[B_s + (B_t - B_s) \mid \mathcal F_s] \\ &= \mathbb E[B_s \mid \mathcal F_s] + \mathbb E[B_t - B_s \mid \mathcal F_s] \end{aligned} $$

证明基于以下三个核心性质:

  1. 可测性 (Measurability):$B_s$ 是 $\mathcal F_s$-可测的。因为 $B_s$ 的值在时间 $s$ 已经确定了,所以 $\mathbb E[B_s \mid \mathcal F_s] = B_s$。
  2. 独立增量 (Independent Increments):根据布朗运动的定义,$B_t - B_s$ 独立于历史信息 $\mathcal F_s$。因此,条件期望退化为无条件期望: $$\mathbb E[B_t - B_s \mid \mathcal F_s] = \mathbb E[B_t - B_s]$$
  3. 零均值 (Zero Mean):根据定义,$B_t - B_s \sim N(0, t-s)$,所以其期望为 0。

结论:

$$\mathbb E[B_t \mid \mathcal F_s] = B_s + 0 = B_s$$

3. 为什么这个性质重要?

在随机微积分中,布朗运动作为鞅意味着它没有“漂移(Drift)”。如果你尝试对布朗运动进行赌博(积分),由于它是鞅,你不可能通过预判过去的路径来获得正的预期收益。

此外,布朗运动还衍生出了另外两个非常重要的鞅,它们在求解首达时间(First Passage Time)和定价模型中极具价值:

  • 平方鞅 (Square Martingale):$M_t = B_t^2 - t$ 是一个鞅。
  • 指数鞅 (Exponential Martingale):$M_t = \exp(\theta B_t - \frac{1}{2}\theta^2 t)$ 是一个鞅。

这两个衍生性质通常是于布朗运动计算题的重点。


在理解了 $B_t$ 是一个**鞅(Martingale)**之后,接下来这个性质揭示了布朗运动更深层的一面:虽然 $B_t$ 本身是无偏的(期望为 0),但它的“波动性”或“能量”(以平方形式表现)是随着时间线性增长的。

为了维持“公平博弈”的特性,我们必须从 $B_t^2$ 中减去这个随时间增长的趋势。

Statement

The process $M_t = B_t^2 - t$ is a martingale with respect to its natural filtration $\mathcal{F}_t$.

Verification

To prove $M_t$ is a martingale, we need to show that for any $s < t$:

$$\mathbb{E}[B_t^2 - t \mid \mathcal{F}_s] = B_s^2 - s$$

利用增量分解 $B_t = B_s + (B_t - B_s)$ 进行推导:

  1. 展开平方项 (Expand the Square):

    $$B_t^2 = (B_s + (B_t - B_s))^2 = B_s^2 + 2B_s(B_t - B_s) + (B_t - B_s)^2$$
  2. 计算条件期望 (Conditional Expectation): 将其代入条件期望表达式中,并利用期望的线性性质:

    $$\mathbb{E}[B_t^2 - t \mid \mathcal{F}_s] = \mathbb{E}[B_s^2 \mid \mathcal{F}_s] + 2\mathbb{E}[B_s(B_t - B_s) \mid \mathcal{F}_s] + \mathbb{E}[(B_t - B_s)^2 \mid \mathcal{F}_s] - \mathbb{E}[t \mid \mathcal{F}_s]$$
  3. 逐项化简 (Term-by-term Simplification):

    • 第一项:$B_s^2$ 是 $\mathcal{F}_s$-可测的,所以 $\mathbb{E}[B_s^2 \mid \mathcal{F}_s] = B_s^2$。
    • 第二项:$B_s$ 是 $\mathcal{F}_s$-可测的,可以提到期望符号外。由于增量 $B_t - B_s$ 与 $\mathcal{F}_s$ 独立且均值为 0: $$2B_s \mathbb{E}[B_t - B_s \mid \mathcal{F}_s] = 2B_s \cdot 0 = 0$$
    • 第三项:$(B_t - B_s)^2$ 与 $\mathcal{F}_s$ 独立。根据布朗运动定义,$B_t - B_s \sim N(0, t-s)$。对于服从 $N(0, \sigma^2)$ 的随机变量,其二阶矩 $\mathbb{E}[X^2] = \sigma^2$: $$\mathbb{E}[(B_t - B_s)^2 \mid \mathcal{F}_s] = \mathbb{E}[(B_t - B_s)^2] = t - s$$
    • 第四项:$t$ 是确定性常数,$\mathbb{E}[t \mid \mathcal{F}_s] = t$。
  4. 合并结果 (Conclusion):

    $$\mathbb{E}[B_t^2 - t \mid \mathcal{F}_s] = B_s^2 + 0 + (t - s) - t = B_s^2 - s$$

    证明完毕。


核心意义

  1. 漂移补偿 (Drift Compensation): $B_t^2$ 本身不是鞅,因为 $\mathbb{E}[B_t^2] = t$。随着时间推移,$B_t^2$ 的平均值在不断增加(这是一个向上飘移的倾向)。 通过减去 $t$,我们抵消了这个系统性的增长。$t$ 在这里被称为 Compensator

  2. 二次变差 (Quadratic Variation): 这个鞅性质实际上暗示了布朗运动的一个关键特征:它的二次变差 $[B, B]_t = t$。 在随机分析中,如果我们知道一个连续鞅 $M_t$ 满足 $M_t^2 - t$ 也是鞅,那么根据 Lévy’s Characterization,这个过程 $M_t$ 必然是布朗运动。


在随机分析的计算中“$B_s$ 是 $\mathcal{F}_s$-可测的” 意味着在给定时刻 $s$ 的信息时,$B_s$ 不再是“随机”的,而是一个已知的确定值。

所以在计算条件期望时,我们可以直接把 $B_s$ 或 $B_s^2$ 像常数一样提到期望符号 $\mathbb{E}[\cdot \mid \mathcal{F}_s]$ 之外。

$$\mathbb{E}[B_s \cdot X \mid \mathcal{F}_s] = B_s \cdot \mathbb{E}[X \mid \mathcal{F}_s]$$

为什么 $E[(B_t - B_s)^2 | \mathcal{F}_s] = E[(B_t - B_s)^2] = t - s$?

这一步推导并非意指“方差的期望等于方差”,而是在利用布朗运动(BM)的**独立增量(Independent Increments)**性质来简化条件期望。

这里有三个核心逻辑步骤:

1. 独立性导致的“条件”失效 (Independence)

Theorem: Independence and Conditional Expectation If a random variable $X$ is independent of a $\sigma$-algebra $\mathcal{G}$, then:

$$E[X \mid \mathcal{G}] = E[X]$$

在布朗运动中,增量 $B_t - B_s$ 独立于历史信息 $\mathcal{F}_s$。因此,增量的平方 $(B_t - B_s)^2$ 也必然独立于 $\mathcal{F}_s$。 这意味着:即便你知道了时刻 $s$ 之前发生的所有事情,也不会改变你对未来增量平方值的“期望预测”。 所以第一个等号成立:

$$E[(B_t - B_s)^2 \mid \mathcal{F}_s] = E[(B_t - B_s)^2]$$

2. 二阶矩与方差的关系 (Second Moment and Variance)

对于任何随机变量 $X$,其方差定义为 $\mathrm{Var}(X) = E[X^2] - (E[X])^2$。 对于布朗运动的增量 $X = B_t - B_s$:

  • 我们已知 $E[B_t - B_s] = 0$。
  • 因此,$\mathrm{Var}(B_t - B_s) = E[(B_t - B_s)^2] - 0^2 = E[(B_t - B_s)^2]$。

也就是说,增量平方的期望,在数值上正好等于该增量的方差


3. 为什么结果是 $t-s$?

这来自于布朗运动定义中的**平稳增量(Stationary Increments)**性质:

Property: Distribution of Increments For any $s < t$:

$$B_t - B_s \sim N(0, t - s)$$

根据正态分布的性质,该随机变量的方差就是其分布参数中的第二个项:

$$\mathrm{Var}(B_t - B_s) = t - s$$

总结 (Summary)

你看到的这个等式实际上是在说:

  1. 左边 $E[(B_t - B_s)^2 \mid \mathcal{F}_s]$:在已知历史的情况下,预测未来波动的平方。
  2. 中间 $E[(B_t - B_s)^2]$:由于未来波动是独立的,这等同于无条件的平均预测。
  3. 右边 $t-s$:根据定义,这个平均预测的数值大小正好等于时间跨度。

这一步是证明 $B_t^2 - t$ 是鞅(Martingale)过程中最关键的一环,它解释了为什么要减去 $t$——因为 $B_t^2$ 包含了一个随时间线性增长的期望值(即方差)。


Continuous-Time Stopping Time

从固定时间 $t$ 转向随机时间 $T$,是随机分析中的一个飞跃。停时(Stopping Time) 的核心在于:你是否决定停止,只能取决于你目前掌握的信息,而不能预知未来。

1. 形式化定义 (Formal Definition)

Definition: Stopping Time A random variable $T: \Omega \to [0, \infty]$ is called a stopping time with respect to the filtration $(\mathcal{F}_t)_{t \ge 0}$ if for every $t \ge 0$:

$$\{ \omega \in \Omega : T(\omega) \le t \} \in \mathcal{F}_t$$
符号数学定义直观理解
$\Omega$样本空间 (Sample Space)所有可能路径的总体
$\omega$样本点 (Outcome)某一条具体的随机路径
$T(\omega)$随机变量的值在路径 $\omega$ 下,发生停止的具体时间点
$\mathcal{F}_t$$\sigma$-代数 ($\sigma$-algebra)到时刻 $t$ 为止我们掌握的全部“历史情报”
$\{T \le t\}$事件 (Event)“停止动作已经在 $t$ 之前发生”这个实验结果集

为什么使用 $\{T \le t\}$ 而非 $\{T = t\}$?

在连续时间中,$P(T = t) = 0$ 对大多数 $t$ 成立(因为 $T$ 通常是连续分布的),所以用 ${T = t}$ 不方便。${T \leq t}$ 问的是"到时间 $t$ 为止,$T$ 是否已经发生了"——这和离散情况的精神是一样的。

在离散时间(Discrete Time)中, $\{T \le t\}$ 和 $\{T = t\}$ 这两个条件是等价的。但在连续时间下,情况有所不同:布朗运动是连续路径。如果我们定义 $T$ 为第一次到达水位 $a$ 的时间,那么 $T$ 取到任何一个精确数值 $t$(如 $\pi$ 秒)的概率通常是 0。事件 $\{T = t\}$ 描述的是一个瞬时点,而 $\{T \le t\}$ 描述的是一个区间。在连续时间流 $(\mathcal{F}_t)$ 中,使用不等式可以确保我们捕捉到过程在 $[0, t]$ 期间的所有累积行为。


Continuous-Time OST

在离散时间中,我们知道一个鞅(公平游戏)在停时 $T$ 停止后,其期望收益依然等于初始值。而在连续时间下,由于路径是连续的且时间是无限的,我们需要更严格的条件来保证这种“公平性”不会在极限处溢出。

1. 定理陈述 (Statement)

Optional Stopping Theorem (Continuous Time) Let $(X_t)_{t \ge 0}$ be a continuous-time martingale with continuous paths, and let $T$ be a stopping time with $P(T < \infty) = 1$. If:

  1. $\mathbb{E}[|X_T|] < \infty$
  2. $\lim_{t \to \infty} \mathbb{E}[|X_t| \mathbf{1}_{\{T > t\}}] = 0$

Then:

$$\mathbb{E}[X_T] = \mathbb{E}[X_0]$$

核心逻辑:

这个定理回答了一个基本问题:“如果我根据目前看到的信息决定什么时候停止博弈,我的预期收益会改变吗?” 如果上述条件满足,答案是:不会。你无法通过选择一个聪明的停时 $T$(只要它不预见未来)来把一个均值为 0 的过程变成均值非 0。


2. 条件的直观解释 (Why these conditions?)

为什么不能直接说 $\mathbb{E}[X_T] = \mathbb{E}[X_0]$?因为如果没有限制,你可以构建出诡异的策略。

  • $P(T < \infty) = 1$: 你必须保证博弈最终会停止。如果你允许博弈永远进行下去(例如:不赢到 100 万绝不停止),那么 $X_T$ 可能根本没有定义。
  • $\lim_{t \to \infty} \mathbb{E}[|X_t| \mathbf{1}_{\{T > t\}}] = 0$: 这是最关键的条件。它保证了那些“还没停止的路径”在时间趋于无穷时,其携带的数值贡献趋于 0。
    • 如果这个条件不满足,说明在非常遥远的未来,还有一些极低概率但数值极大的路径(例如倍投策略中的巨额亏损),它们会破坏整体期望的平衡。

3. 实际应用准则 (Practical Criteria)

STA447 的题目中,直接验证上面的极限条件通常很麻烦。我们通常使用以下两个更简单的充分条件

A. 过程在停止前是有界的 (Bounded before stopping)

If there exists a constant $M < \infty$ such that $|X_{t \wedge T}| \le M$ for all $t \ge 0$ (almost surely).

  • 例子:考虑布朗运动 $B_t$ 在到达 $a$ 或 $b$($a < 0 < b$)时停止。由于路径在停止前始终被困在 $[a, b]$ 区间内,它是一致有界的。此时可以直接应用 OST。

B. 一致可积性 (Uniform Integrability, UI)

If the martingale $\{X_t\}_{t \ge 0}$ is uniformly integrable.

  • 一致可积是一个比“有界”更宽泛的数学性质,它确保了我们可以交换极限符号与期望符号(即应用勒贝格控制收敛定理)。

Continuous-Time Gambler’s Ruin

问题: $(B_t)_{t \geq 0}$ 是 BM。$a, b > 0$。$T = \inf\{t \geq 0 : B_t = -a \text{ or } B_t = b\}$。求 $P(B_T = b)$ 和 $E[T]$。

Part 1:求 $P(B_T = b)$

用 $B_t$ 这个 martingale。

在 $T$ 之前,$-a \leq B_t \leq b$(还没 exit),所以 $|B_t| \leq \max(a, b)$,有界。OST 适用。

$$E[B_T] = E[B_0] = 0$$

$B_T$ 只能取 $b$ 或 $-a$:

$$b \cdot P(B_T = b) + (-a) \cdot P(B_T = -a) = 0$$

又 $P(B_T = b) + P(B_T = -a) = 1$,设 $p = P(B_T = b)$:

$$bp - a(1 - p) = 0$$$$bp - a + ap = 0$$$$p(a + b) = a$$$$p = \frac{a}{a + b}$$

Part 2:求 $E[T]$

用 $M_t = B_t^2 - t$ 这个 martingale。

需要验证 OST 条件。这比 Part 1 更微妙,因为 $M_t$ 在 $T$ 之前不是有界的($B_t^2$ 有界,但 $-t$ 可以任意负)。

处理方式:先证 $E[T] < \infty$。

怎么证?考虑一个固定的时间 $T_0$。从 $(-a, b)$ 区间的任意起点出发,BM 在时间 $T_0$ 内到达 $-a$ 或 $b$ 的概率有一个正的下界 $\eta > 0$(这是因为 $B_{T_0} \sim N(B_0, T_0)$,正态分布的尾概率始终为正)。

所以每过 $T_0$ 时间,有至少 $\eta$ 的概率停下来。这意味着:

$$P(T > kT_0) \leq (1 - \eta)^k$$

所以 $T$ 有指数衰减的尾概率,$E[T] < \infty$。

有了 $E[T] < \infty$,可以证明 $E[|M_t| \cdot \mathbf{1}(T > t)] \to 0$(因为 $|M_t| \leq \max(a,b)^2 + t$,而 $P(T > t)$ 指数衰减),OST 条件满足。

应用 OST:

$$E[M_T] = E[M_0] = B_0^2 - 0 = 0$$$$E[B_T^2 - T] = 0$$$$E[B_T^2] = E[T]$$

计算 $E[B_T^2]$:

$$E[B_T^2] = b^2 \cdot P(B_T = b) + (-a)^2 \cdot P(B_T = -a)$$$$= b^2 \cdot \frac{a}{a+b} + a^2 \cdot \frac{b}{a+b}$$$$= \frac{ab^2 + a^2 b}{a+b} = \frac{ab(a+b)}{a+b} = ab$$

所以 $E[T] = ab$。

注意这里用了两个不同的 martingale 解同一个问题的两个不同方面: $B_t$ 求 hitting probability,$B_t^2 - t$ 求 expected hitting time。这和离散 Gambler’s Ruin 中用 $X_n$ 和 $X_n^2 - n$ 的思路完全一样。


7. Reflection Principle

问题: $T_a = \inf\{t > 0 : B_t \geq a\}$(首次到达 $a$ 的时间),$a > 0$。求 $P(T_a \leq t)$。

关键观察:

$$P(T_a \leq t) = P\left(\max_{0 \leq s \leq t} B_s \geq a\right)$$

这是因为"在时间 $t$ 之前到达过 $a$“等价于"路径的最大值 $\geq a$"。

推导: 把事件 $B_t \geq a$ 按 $T_a$ 是否 $\leq t$ 来分:

$$P(B_t \geq a) = P(T_a \leq t) \cdot P(B_t \geq a \mid T_a \leq t)$$

(如果 $T_a > t$,即在时间 $t$ 之前从未到过 $a$,那 $B_t \geq a$ 不可能发生。因为 BM 路径连续,不到 $a$ 就不可能超过 $a$。所以 $P(B_t \geq a, T_a > t) = 0$。)

现在算 $P(B_t \geq a \mid T_a \leq t)$。

给定 $T_a \leq t$,BM 在时间 $T_a$ 时到达了 $a$。由 Strong Markov Property,$(B_{T_a + s} - B_{T_a})_{s \geq 0}$ 是一个全新的 BM,独立于 $T_a$ 之前的信息。

所以:

$$P(B_t \geq a \mid T_a \leq t) = P(B_t - B_{T_a} \geq 0 \mid T_a \leq t)$$

$B_t - B_{T_a}$ 是新 BM 在时间 $t - T_a$ 的值,分布是 $N(0, t - T_a)$。正态分布关于 0 对称,所以:

$$P(B_t - B_{T_a} \geq 0 \mid T_a \leq t) = \frac{1}{2}$$

代回去:

$$P(B_t \geq a) = P(T_a \leq t) \cdot \frac{1}{2}$$

所以:

$$P(T_a \leq t) = 2 \cdot P(B_t \geq a) = 2\Phi\left(-\frac{a}{\sqrt{t}}\right)$$

(其中 $\Phi$ 是标准正态 CDF,$P(B_t \geq a) = P\left(\frac{B_t}{\sqrt{t}} \geq \frac{a}{\sqrt{t}}\right) = 1 - \Phi\left(\frac{a}{\sqrt{t}}\right) = \Phi\left(-\frac{a}{\sqrt{t}}\right)$)

Reflection Principle 的一个推论

$$P\left(\max_{0 \leq s \leq t} B_s \geq a\right) = P(T_a \leq t) = 2P(B_t \geq a) = P(|B_t| \geq a)$$

所以 $\max_{0 \leq s \leq t} B_s$ 和 $|B_t|$ 有相同的分布。

这个结论很漂亮:BM 路径在 $[0, t]$ 上的最大值的分布,完全由终点 $B_t$ 的绝对值决定。

8. Phase 6 小结

概念要点
BM 定义$B_0=0$、独立增量、$B_t - B_s \sim N(0, t-s)$、连续路径
BM 作为 MG$B_t$ 是 MG,$B_t^2 - t$ 也是 MG
Continuous-time OST形式和离散版本相同,条件相同
Gambler’s Ruin$B_t$ → hitting prob $= a/(a+b)$;$B_t^2 - t$ → $E[T] = ab$
Reflection Principle$P(T_a \leq t) = 2P(B_t \geq a)$,$\max B_s \sim$
处处不可微导数的方差 $\to \infty$ → 需要新的 calculus