Brownian Motion
1. Definition
A process $(B_t)_{t\ge 0}$ is Brownian motion if:
- $B_0=0$
- It has independent increments
- For every $s
- Its sample paths are continuous almost surely
在布朗运动中,$B_t$ 可以取任意实数,即状态空间为 $(-\infty, +\infty)$。它不是一个固定的常数,而是一个随时间变化的随机变量。
方差 $\mathrm{Var}(B_t) = t$:这描述的是 $B_t$ 偏离中心点(0)的程度。方差等于 $t$ 意味着随着时间增加,粒子扩散得越来越远。
根据定义的第三条性质,在任何给定的时间 $t > 0$,状态 $B_t$ 服从正态分布:
$$B_t \sim N(0, t)$$这意味着:
- 理论取值:在时刻 $t$,粒子的位置可以出现在坐标轴上的任何一点。
- 概率分布:取值在 $0$ 附近的概率最高。随着时间 $t$ 的流逝,方差 $t$ 变大,正态分布的钟形曲线变得更宽更扁平,$B_t$ 取到绝对值较大的数(即远离原点)的概率逐渐增加。
大写的 $B$ 通常代表整个随机过程 $(B_t)_{t \ge 0}$(即所有可能的连续轨迹的集合),而我们讨论“取值”时,通常是指在特定时刻 $t$ 的随机变量 $B_t$。
从条件 2 和 3 可以推出: $(B_{t_1}, B_{t_2}, \ldots, B_{t_k})$ 是 multivariate normal(多元正态)。满足这个性质的过程叫做 Gaussian Process。
Brownian Motion as a Gaussian Process
1. Definition
Theorem: Brownian Motion as a Gaussian Process A standard Brownian motion $(B_t)_{t \ge 0}$ is a Gaussian process. Its finite-dimensional distributions are completely characterized by its mean function and covariance function:
- Mean function: $m(t) = \mathbb{E}[B_t] = 0$
- Covariance function: $C(s, t) = \mathrm{Cov}(B_s, B_t) = \min(s, t)$
Explanation
高斯过程的严格定义要求其任意有限维边缘分布均为多元正态分布。对于布朗运动,给定任意时间序列 $0 < t_1 < t_2 < \dots < t_k$,可以通过其独立增量性质严格证明 $(B_{t_1}, \dots, B_{t_k})$ 服从多元正态分布。
由于增量 $B_{t_1}, B_{t_2} - B_{t_1}, \dots, B_{t_k} - B_{t_{k-1}}$ 是一组相互独立且服从一维正态分布的随机变量,而状态向量 $(B_{t_1}, \dots, B_{t_k})$ 可以表示为这些独立增量的线性变换,因此该状态向量必然服从多元正态分布。
关于协方差函数 $C(s, t) = \min(s, t)$ 的代数推导如下。假设 $0 \le s \le t$:
$$ \begin{aligned} \mathrm{Cov}(B_s, B_t) &= \mathbb{E}[(B_s - \mathbb{E}[B_s])(B_t - \mathbb{E}[B_t])] \\ &= \mathbb{E}[B_s B_t] \\ &= \mathbb{E}[B_s (B_s + B_t - B_s)] \\ &= \mathbb{E}[B_s^2 + B_s(B_t - B_s)] \\ &= \mathbb{E}[B_s^2] + \mathbb{E}[B_s(B_t - B_s)] \end{aligned} $$根据布朗运动的独立增量性质,$B_s$(即 $B_s - B_0$)与 $B_t - B_s$ 相互独立。同时由于 $\mathbb{E}[B_t - B_s] = 0$,交叉项的期望为:
$$ \mathbb{E}[B_s(B_t - B_s)] = \mathbb{E}[B_s]\mathbb{E}[B_t - B_s] = 0 $$根据定义,$\mathbb{E}[B_s^2] = \mathrm{Var}(B_s) = s$。因此,当 $s \le t$ 时,$\mathrm{Cov}(B_s, B_t) = s$。 基于对称性,对任意给定的 $s, t \ge 0$,该结果可以推广为 $\mathrm{Cov}(B_s, B_t) = \min(s, t)$。
因为高斯过程由其一阶矩和二阶矩完全决定,上述均值和协方差函数唯一确定了布朗运动的全部有限维分布。
从 SRW 到 Brownian Motion
1. 缩放思想 (Scaling Idea)
- 基础模型:$X_n = \sum_{i=1}^n \varepsilon_i$ 这是一个标准的对称随机游走。想象你站在原点,每秒钟抛一次硬币($\varepsilon_i$),正面就向右走1步(+1),反面就向左走1步(-1)。
- 时空缩放 (Time-Space Scaling):$\frac{1}{\sqrt n}X_{\lfloor nt\rfloor}$
为了从离散走向连续,我们需要“加快脚步”并“缩小步幅”。
- 时间加速:$\lfloor nt\rfloor$ 意味着在 $t$ 时间内,我们原本只走 $t$ 步,现在我们要走 $n \times t$ 步。当 $n$ 很大时,我们在极短的时间内走了无数步。
- 空间压缩:$\frac{1}{\sqrt n}$ 是为了平衡时间的加速。为什么除以 $\sqrt{n}$ 而不是 $n$?因为方差是线性累加的,而标准差是平方根累加的。如果空间除以 $n$,路径最后会缩成一条直线(大数定律);只有除以 $\sqrt{n}$,随机性的波动才会被完美保留下来。
2. 极限分布 (Limiting Distribution)
- 中心极限定理的威力: 由于 $\varepsilon_i$ 是独立同分布的,期望为0,方差为1。根据中心极限定理,大量独立随机变量的和趋向于正态分布。因此,缩放后的位置趋向于 $N(0,t)$。
- 方差的完美契合: 每一步的方差是1。走了 $\lfloor nt\rfloor$ 步,总方差就是 $\lfloor nt\rfloor$。因为我们在空间上缩放了 $\frac{1}{\sqrt n}$,所以总方差要乘以 $(\frac{1}{\sqrt n})^2 = \frac{1}{n}$。 最终方差计算为: $$\mathrm{Var}\left(\frac{1}{\sqrt n}X_{\lfloor nt\rfloor}\right) = \frac{\lfloor nt\rfloor}{n} \to t$$ 这正好匹配了标准布朗运动 $B(t)$ 的核心性质:$B(t)$ 服从正态分布,期望为0,方差为 $t$。
3. 核心意义 (Why this matters)
布朗运动不仅是一个纯粹的数学构造(连续时间、连续状态空间的马尔可夫过程),它更是所有具有有限方差的独立增量过程的“通用宏观极限”。
这就像物理学中的流体:微观上是无数个水分子在做杂乱无章的碰撞(随机游走),但在宏观尺度下,只要我们把时间和空间按照 $t$ 和 $\sqrt{t}$ 的比例缩小,我们看到的将是一个连续的、具有高度分形特征的流体运动(布朗运动)。
Brownian Motion’s Properties
Theorem A: Markov Property of Brownian Motion
let $(B_t)_{t \ge 0}$ be a standard Brownian motion and let $\mathcal{F}_t = \sigma(B_s : 0 \le s \le t)$ be the natural filtration representing the history of the process up to time $t$.
For any $r > t$ and any measurable function $f$:
$$E[f(B_r) \mid \mathcal{F}_t] = E[f(B_r) \mid B_t]$$Equivalently, the conditional distribution of $B_r$ given the entire past $\mathcal{F}_t$ depends only on the current state $B_t$.
逻辑证明 (Reasoning): 根据布朗运动的定义,其增量是独立的。 对于任何 $s > 0$,未来位置可以表示为:$B_{t+s} = B_t + (B_{t+s} - B_t)$。 由于增量 $(B_{t+s} - B_t)$ 独立于截止到 $t$ 时刻的所有历史信息 $\mathcal{F}_t$,因此给定 $B_t$ 后,历史轨迹对预测 $B_{t+s}$ 的分布没有贡献。
马尔可夫性要求时间 $t$ 必须是预先确定的。但在研究中,我们经常关注由路径本身决定的随机时间,例如“第一次到达某个水位 $a$ 的时刻”。这种时间被称为停时(Stopping Time)。
Definition: Stopping Time A random variable $T: \Omega \to [0, \infty]$ is a stopping time with respect to the filtration $(\mathcal{F}_t)_{t \ge 0}$ if for every $t \ge 0$, the event $\{T \le t\} \in \mathcal{F}_t$.
Theorem B: Strong Markov Property of Brownian Motion
Let $T$ be a stopping time such that $P(T < \infty) = 1$. Then the process $\tilde{B}_s = B_{T+s} - B_T$ ($s \ge 0$) is a standard Brownian motion independent of the pre-T sigma-field $\mathcal{F}_T$.
逻辑意义: 强马尔可夫性意味着布朗运动在停时 $T$ “重新开始”了。无论 $T$ 的取值如何(只要它不预见未来),布朗运动从该随机时刻起的后续行为依然像是一个全新的、从原点出发的布朗运动。
两者的区别与联系
| 特性 | 时间 $T$ 的性质 | 描述 | 关键用途 |
|---|---|---|---|
| Markov Property | 确定性数值 (Deterministic) | 给定 $B_t$,未来独立于过去。 | 导出转移概率密度 (Transition density)。 |
| Strong Markov Property | 随机停时 (Stopping Time) | 在随机时刻 $T$ 重新出发,依然是 BM。 | 证明反射原理 (Reflection Principle),计算首达时间分布。 |
为什么布朗运动具有强马尔可夫性? 并非所有马尔可夫过程都具有强马尔可夫性。布朗运动之所以具备此性质,是因为其路径是几乎处处连续的。这种连续性确保了在停时 $T$ 附近的极限行为是稳定的,从而允许我们将固定时间的性质推广到随机停时上。
如果没有强马尔可夫性,我们就无法通过对称性来证明反射原理(即 $P(\sup_{0\le s\le t} B_s \ge a) = 2P(B_t \ge a)$)。
Theorem C: Brownian Motion is continuous everywhere but not differentiable everywhere.
性质 C 描述了布朗运动最令人着迷且最具挑战性的几何特性:它是一条连续的“无限锯齿”。
1. 连续性与不可微性的对立 (Continuity vs. Differentiability)
根据定义条件 4,布朗运动的路径样本 $t \mapsto B_t$ 是几乎处处连续 (a.s. continuous) 的。这意味着粒子不会发生瞬间的位移跳跃。
然而,连续并不意味着平滑。在普通微积分中,我们定义导数为:
$$f'(t) = \lim_{\Delta t \to 0} \frac{f(t+\Delta t) - f(t)}{\Delta t}$$对于布朗运动,我们考察这个差分商的统计特性。
2. 方差爆炸推导 (Variance Explosion)
根据布朗运动的平稳独立增量性质:
$$B_{t+\Delta t} - B_t \sim N(0, \Delta t)$$设差分商为 $V_{\Delta t} = \frac{B_{t+\Delta t} - B_t}{\Delta t}$。利用正态分布的缩放性质:
$$\text{Var}(V_{\Delta t}) = \text{Var}\left( \frac{1}{\Delta t} (B_{t+\Delta t} - B_t) \right) = \frac{1}{(\Delta t)^2} \text{Var}(B_{t+\Delta t} - B_t)$$将 $\text{Var}(B_{t+\Delta t} - B_t) = \Delta t$ 代入:
$$\text{Var}(V_{\Delta t}) = \frac{\Delta t}{(\Delta t)^2} = \frac{1}{\Delta t}$$结论: 当 $\Delta t \to 0$ 时,$\text{Var}(V_{\Delta t}) \to \infty$。 这意味着随着观测时间窗口的缩小,平均速度(斜率)的波动不仅没有趋于稳定,反而变得无穷大。因此,在任何点 $t$,极限 $\lim_{\Delta t \to 0} V_{\Delta t}$ 在概率意义上都不存在。
3. 几何直观与分形特征
布朗运动的路径具有自相似性 (Self-similarity)。如果你放大路径的任何一段,你会发现它看起来和整体一样剧烈震荡。
- 普通平滑函数:放大后会看起来像一条直线(线性逼近)。
- 布朗运动:无论放大多少倍,它依然是无数个细小的 V 型或柱状震荡。
这种性质在数学上由 Paley-Wiener-Zygmund Theorem 严格证明:在概率为 1 的情况下,布朗运动路径在任何点都不存在有限导数。
4. 对随机微积分的影响 (Need for Itô Calculus)
这种“处处不可微”性质导致了经典黎曼-斯蒂尔杰斯积分 (Riemann-Stieltjes integral) 的失效。 在经典微积分中,微分项 $df = f'(t)dt$。 但在布朗运动中,由于 $dB_t$ 的量级大约是 $\sqrt{dt}$(因为 $\text{Var}(dB_t) = dt$),所以:
$$(dB_t)^2 \approx dt$$这就导致了 Itô’s Lemma 中出现了二阶导数项。如果你尝试用普通链式法则处理 $B_t^2$ 的微分,你会漏掉一个关键的常数项,因为布朗运动的二阶变差 (Quadratic Variation) 不为零。
Summary Table:
| 特征 | 经典函数 (Smooth) | 布朗运动 (BM) |
|---|---|---|
| 增量数量级 | $\Delta f \sim \Delta t$ | $\Delta B \sim \sqrt{\Delta t}$ |
| 差分商极限 | 收敛于 $f'(t)$ | 方差 $\to \infty$,不收敛 |
| 路径几何 | 局部线性 | 局部维数为 1.5 的分形 |
| 二阶变差 | $[f, f]_t = 0$ | $[B, B]_t = t$ |
Brownian Motion is Martingale
接下来的内容探讨了布朗运动在**鞅(Martingale)**理论中的地位。这是随机分析(Stochastic Analysis)的核心,也是后续研究伊藤积分(Itô Integral)的基础。
1. 命题 (Statement)
Brownian motion $(B_t)_{t\ge 0}$ is a martingale with respect to its natural filtration $(\mathcal F_t)$.
这里的 $\mathcal F_t = \sigma(B_u : 0 \le u \le t)$ 代表了到时间 $t$ 为止该过程产生的所有信息(即“历史”)。一个过程被称为鞅,通俗地说,就是它代表了一个**“公平游戏”**:给定现在的观测值,未来的期望值就等于现在的观测值。
2. 严格证明 (Verification)
For $s < t$, to show $(B_t)$ is a martingale, we must verify $\mathbb E[B_t \mid \mathcal F_s] = B_s$.
$$ \begin{aligned} \mathbb E[B_t \mid \mathcal F_s] &= \mathbb E[B_s + (B_t - B_s) \mid \mathcal F_s] \\ &= \mathbb E[B_s \mid \mathcal F_s] + \mathbb E[B_t - B_s \mid \mathcal F_s] \end{aligned} $$证明基于以下三个核心性质:
- 可测性 (Measurability):$B_s$ 是 $\mathcal F_s$-可测的。因为 $B_s$ 的值在时间 $s$ 已经确定了,所以 $\mathbb E[B_s \mid \mathcal F_s] = B_s$。
- 独立增量 (Independent Increments):根据布朗运动的定义,$B_t - B_s$ 独立于历史信息 $\mathcal F_s$。因此,条件期望退化为无条件期望: $$\mathbb E[B_t - B_s \mid \mathcal F_s] = \mathbb E[B_t - B_s]$$
- 零均值 (Zero Mean):根据定义,$B_t - B_s \sim N(0, t-s)$,所以其期望为 0。
结论:
$$\mathbb E[B_t \mid \mathcal F_s] = B_s + 0 = B_s$$3. 为什么这个性质重要?
在随机微积分中,布朗运动作为鞅意味着它没有“漂移(Drift)”。如果你尝试对布朗运动进行赌博(积分),由于它是鞅,你不可能通过预判过去的路径来获得正的预期收益。
此外,布朗运动还衍生出了另外两个非常重要的鞅,它们在求解首达时间(First Passage Time)和定价模型中极具价值:
- 平方鞅 (Square Martingale):$M_t = B_t^2 - t$ 是一个鞅。
- 指数鞅 (Exponential Martingale):$M_t = \exp(\theta B_t - \frac{1}{2}\theta^2 t)$ 是一个鞅。
这两个衍生性质通常是于布朗运动计算题的重点。
在理解了 $B_t$ 是一个**鞅(Martingale)**之后,接下来这个性质揭示了布朗运动更深层的一面:虽然 $B_t$ 本身是无偏的(期望为 0),但它的“波动性”或“能量”(以平方形式表现)是随着时间线性增长的。
为了维持“公平博弈”的特性,我们必须从 $B_t^2$ 中减去这个随时间增长的趋势。
Statement
The process $M_t = B_t^2 - t$ is a martingale with respect to its natural filtration $\mathcal{F}_t$.
Verification
To prove $M_t$ is a martingale, we need to show that for any $s < t$:
$$\mathbb{E}[B_t^2 - t \mid \mathcal{F}_s] = B_s^2 - s$$利用增量分解 $B_t = B_s + (B_t - B_s)$ 进行推导:
展开平方项 (Expand the Square):
$$B_t^2 = (B_s + (B_t - B_s))^2 = B_s^2 + 2B_s(B_t - B_s) + (B_t - B_s)^2$$计算条件期望 (Conditional Expectation): 将其代入条件期望表达式中,并利用期望的线性性质:
$$\mathbb{E}[B_t^2 - t \mid \mathcal{F}_s] = \mathbb{E}[B_s^2 \mid \mathcal{F}_s] + 2\mathbb{E}[B_s(B_t - B_s) \mid \mathcal{F}_s] + \mathbb{E}[(B_t - B_s)^2 \mid \mathcal{F}_s] - \mathbb{E}[t \mid \mathcal{F}_s]$$逐项化简 (Term-by-term Simplification):
- 第一项:$B_s^2$ 是 $\mathcal{F}_s$-可测的,所以 $\mathbb{E}[B_s^2 \mid \mathcal{F}_s] = B_s^2$。
- 第二项:$B_s$ 是 $\mathcal{F}_s$-可测的,可以提到期望符号外。由于增量 $B_t - B_s$ 与 $\mathcal{F}_s$ 独立且均值为 0: $$2B_s \mathbb{E}[B_t - B_s \mid \mathcal{F}_s] = 2B_s \cdot 0 = 0$$
- 第三项:$(B_t - B_s)^2$ 与 $\mathcal{F}_s$ 独立。根据布朗运动定义,$B_t - B_s \sim N(0, t-s)$。对于服从 $N(0, \sigma^2)$ 的随机变量,其二阶矩 $\mathbb{E}[X^2] = \sigma^2$: $$\mathbb{E}[(B_t - B_s)^2 \mid \mathcal{F}_s] = \mathbb{E}[(B_t - B_s)^2] = t - s$$
- 第四项:$t$ 是确定性常数,$\mathbb{E}[t \mid \mathcal{F}_s] = t$。
合并结果 (Conclusion):
$$\mathbb{E}[B_t^2 - t \mid \mathcal{F}_s] = B_s^2 + 0 + (t - s) - t = B_s^2 - s$$证明完毕。
核心意义
漂移补偿 (Drift Compensation): $B_t^2$ 本身不是鞅,因为 $\mathbb{E}[B_t^2] = t$。随着时间推移,$B_t^2$ 的平均值在不断增加(这是一个向上飘移的倾向)。 通过减去 $t$,我们抵消了这个系统性的增长。$t$ 在这里被称为 Compensator。
二次变差 (Quadratic Variation): 这个鞅性质实际上暗示了布朗运动的一个关键特征:它的二次变差 $[B, B]_t = t$。 在随机分析中,如果我们知道一个连续鞅 $M_t$ 满足 $M_t^2 - t$ 也是鞅,那么根据 Lévy’s Characterization,这个过程 $M_t$ 必然是布朗运动。
在随机分析的计算中“$B_s$ 是 $\mathcal{F}_s$-可测的” 意味着在给定时刻 $s$ 的信息时,$B_s$ 不再是“随机”的,而是一个已知的确定值。
所以在计算条件期望时,我们可以直接把 $B_s$ 或 $B_s^2$ 像常数一样提到期望符号 $\mathbb{E}[\cdot \mid \mathcal{F}_s]$ 之外。
$$\mathbb{E}[B_s \cdot X \mid \mathcal{F}_s] = B_s \cdot \mathbb{E}[X \mid \mathcal{F}_s]$$为什么 $E[(B_t - B_s)^2 | \mathcal{F}_s] = E[(B_t - B_s)^2] = t - s$?
这一步推导并非意指“方差的期望等于方差”,而是在利用布朗运动(BM)的**独立增量(Independent Increments)**性质来简化条件期望。
这里有三个核心逻辑步骤:
1. 独立性导致的“条件”失效 (Independence)
Theorem: Independence and Conditional Expectation If a random variable $X$ is independent of a $\sigma$-algebra $\mathcal{G}$, then:
$$E[X \mid \mathcal{G}] = E[X]$$在布朗运动中,增量 $B_t - B_s$ 独立于历史信息 $\mathcal{F}_s$。因此,增量的平方 $(B_t - B_s)^2$ 也必然独立于 $\mathcal{F}_s$。 这意味着:即便你知道了时刻 $s$ 之前发生的所有事情,也不会改变你对未来增量平方值的“期望预测”。 所以第一个等号成立:
$$E[(B_t - B_s)^2 \mid \mathcal{F}_s] = E[(B_t - B_s)^2]$$2. 二阶矩与方差的关系 (Second Moment and Variance)
对于任何随机变量 $X$,其方差定义为 $\mathrm{Var}(X) = E[X^2] - (E[X])^2$。 对于布朗运动的增量 $X = B_t - B_s$:
- 我们已知 $E[B_t - B_s] = 0$。
- 因此,$\mathrm{Var}(B_t - B_s) = E[(B_t - B_s)^2] - 0^2 = E[(B_t - B_s)^2]$。
也就是说,增量平方的期望,在数值上正好等于该增量的方差。
3. 为什么结果是 $t-s$?
这来自于布朗运动定义中的**平稳增量(Stationary Increments)**性质:
Property: Distribution of Increments For any $s < t$:
$$B_t - B_s \sim N(0, t - s)$$根据正态分布的性质,该随机变量的方差就是其分布参数中的第二个项:
$$\mathrm{Var}(B_t - B_s) = t - s$$总结 (Summary)
你看到的这个等式实际上是在说:
- 左边 $E[(B_t - B_s)^2 \mid \mathcal{F}_s]$:在已知历史的情况下,预测未来波动的平方。
- 中间 $E[(B_t - B_s)^2]$:由于未来波动是独立的,这等同于无条件的平均预测。
- 右边 $t-s$:根据定义,这个平均预测的数值大小正好等于时间跨度。
这一步是证明 $B_t^2 - t$ 是鞅(Martingale)过程中最关键的一环,它解释了为什么要减去 $t$——因为 $B_t^2$ 包含了一个随时间线性增长的期望值(即方差)。
Continuous-Time Stopping Time
从固定时间 $t$ 转向随机时间 $T$,是随机分析中的一个飞跃。停时(Stopping Time) 的核心在于:你是否决定停止,只能取决于你目前掌握的信息,而不能预知未来。
1. 形式化定义 (Formal Definition)
Definition: Stopping Time A random variable $T: \Omega \to [0, \infty]$ is called a stopping time with respect to the filtration $(\mathcal{F}_t)_{t \ge 0}$ if for every $t \ge 0$:
$$\{ \omega \in \Omega : T(\omega) \le t \} \in \mathcal{F}_t$$| 符号 | 数学定义 | 直观理解 |
|---|---|---|
| $\Omega$ | 样本空间 (Sample Space) | 所有可能路径的总体 |
| $\omega$ | 样本点 (Outcome) | 某一条具体的随机路径 |
| $T(\omega)$ | 随机变量的值 | 在路径 $\omega$ 下,发生停止的具体时间点 |
| $\mathcal{F}_t$ | $\sigma$-代数 ($\sigma$-algebra) | 到时刻 $t$ 为止我们掌握的全部“历史情报” |
| $\{T \le t\}$ | 事件 (Event) | “停止动作已经在 $t$ 之前发生”这个实验结果集 |
为什么使用 $\{T \le t\}$ 而非 $\{T = t\}$?
在连续时间中,$P(T = t) = 0$ 对大多数 $t$ 成立(因为 $T$ 通常是连续分布的),所以用 ${T = t}$ 不方便。${T \leq t}$ 问的是"到时间 $t$ 为止,$T$ 是否已经发生了"——这和离散情况的精神是一样的。
在离散时间(Discrete Time)中, $\{T \le t\}$ 和 $\{T = t\}$ 这两个条件是等价的。但在连续时间下,情况有所不同:布朗运动是连续路径。如果我们定义 $T$ 为第一次到达水位 $a$ 的时间,那么 $T$ 取到任何一个精确数值 $t$(如 $\pi$ 秒)的概率通常是 0。事件 $\{T = t\}$ 描述的是一个瞬时点,而 $\{T \le t\}$ 描述的是一个区间。在连续时间流 $(\mathcal{F}_t)$ 中,使用不等式可以确保我们捕捉到过程在 $[0, t]$ 期间的所有累积行为。
Continuous-Time OST
在离散时间中,我们知道一个鞅(公平游戏)在停时 $T$ 停止后,其期望收益依然等于初始值。而在连续时间下,由于路径是连续的且时间是无限的,我们需要更严格的条件来保证这种“公平性”不会在极限处溢出。
1. 定理陈述 (Statement)
Optional Stopping Theorem (Continuous Time) Let $(X_t)_{t \ge 0}$ be a continuous-time martingale with continuous paths, and let $T$ be a stopping time with $P(T < \infty) = 1$. If:
- $\mathbb{E}[|X_T|] < \infty$
- $\lim_{t \to \infty} \mathbb{E}[|X_t| \mathbf{1}_{\{T > t\}}] = 0$
Then:
$$\mathbb{E}[X_T] = \mathbb{E}[X_0]$$核心逻辑:
这个定理回答了一个基本问题:“如果我根据目前看到的信息决定什么时候停止博弈,我的预期收益会改变吗?” 如果上述条件满足,答案是:不会。你无法通过选择一个聪明的停时 $T$(只要它不预见未来)来把一个均值为 0 的过程变成均值非 0。
2. 条件的直观解释 (Why these conditions?)
为什么不能直接说 $\mathbb{E}[X_T] = \mathbb{E}[X_0]$?因为如果没有限制,你可以构建出诡异的策略。
- $P(T < \infty) = 1$: 你必须保证博弈最终会停止。如果你允许博弈永远进行下去(例如:不赢到 100 万绝不停止),那么 $X_T$ 可能根本没有定义。
- $\lim_{t \to \infty} \mathbb{E}[|X_t| \mathbf{1}_{\{T > t\}}] = 0$:
这是最关键的条件。它保证了那些“还没停止的路径”在时间趋于无穷时,其携带的数值贡献趋于 0。
- 如果这个条件不满足,说明在非常遥远的未来,还有一些极低概率但数值极大的路径(例如倍投策略中的巨额亏损),它们会破坏整体期望的平衡。
3. 实际应用准则 (Practical Criteria)
在 STA447 的题目中,直接验证上面的极限条件通常很麻烦。我们通常使用以下两个更简单的充分条件:
A. 过程在停止前是有界的 (Bounded before stopping)
If there exists a constant $M < \infty$ such that $|X_{t \wedge T}| \le M$ for all $t \ge 0$ (almost surely).
- 例子:考虑布朗运动 $B_t$ 在到达 $a$ 或 $b$($a < 0 < b$)时停止。由于路径在停止前始终被困在 $[a, b]$ 区间内,它是一致有界的。此时可以直接应用 OST。
B. 一致可积性 (Uniform Integrability, UI)
If the martingale $\{X_t\}_{t \ge 0}$ is uniformly integrable.
- 一致可积是一个比“有界”更宽泛的数学性质,它确保了我们可以交换极限符号与期望符号(即应用勒贝格控制收敛定理)。
Continuous-Time Gambler’s Ruin
问题: $(B_t)_{t \geq 0}$ 是 BM。$a, b > 0$。$T = \inf\{t \geq 0 : B_t = -a \text{ or } B_t = b\}$。求 $P(B_T = b)$ 和 $E[T]$。
Part 1:求 $P(B_T = b)$
用 $B_t$ 这个 martingale。
在 $T$ 之前,$-a \leq B_t \leq b$(还没 exit),所以 $|B_t| \leq \max(a, b)$,有界。OST 适用。
$$E[B_T] = E[B_0] = 0$$$B_T$ 只能取 $b$ 或 $-a$:
$$b \cdot P(B_T = b) + (-a) \cdot P(B_T = -a) = 0$$又 $P(B_T = b) + P(B_T = -a) = 1$,设 $p = P(B_T = b)$:
$$bp - a(1 - p) = 0$$$$bp - a + ap = 0$$$$p(a + b) = a$$$$p = \frac{a}{a + b}$$Part 2:求 $E[T]$
用 $M_t = B_t^2 - t$ 这个 martingale。
需要验证 OST 条件。这比 Part 1 更微妙,因为 $M_t$ 在 $T$ 之前不是有界的($B_t^2$ 有界,但 $-t$ 可以任意负)。
处理方式:先证 $E[T] < \infty$。
怎么证?考虑一个固定的时间 $T_0$。从 $(-a, b)$ 区间的任意起点出发,BM 在时间 $T_0$ 内到达 $-a$ 或 $b$ 的概率有一个正的下界 $\eta > 0$(这是因为 $B_{T_0} \sim N(B_0, T_0)$,正态分布的尾概率始终为正)。
所以每过 $T_0$ 时间,有至少 $\eta$ 的概率停下来。这意味着:
$$P(T > kT_0) \leq (1 - \eta)^k$$所以 $T$ 有指数衰减的尾概率,$E[T] < \infty$。
有了 $E[T] < \infty$,可以证明 $E[|M_t| \cdot \mathbf{1}(T > t)] \to 0$(因为 $|M_t| \leq \max(a,b)^2 + t$,而 $P(T > t)$ 指数衰减),OST 条件满足。
应用 OST:
$$E[M_T] = E[M_0] = B_0^2 - 0 = 0$$$$E[B_T^2 - T] = 0$$$$E[B_T^2] = E[T]$$计算 $E[B_T^2]$:
$$E[B_T^2] = b^2 \cdot P(B_T = b) + (-a)^2 \cdot P(B_T = -a)$$$$= b^2 \cdot \frac{a}{a+b} + a^2 \cdot \frac{b}{a+b}$$$$= \frac{ab^2 + a^2 b}{a+b} = \frac{ab(a+b)}{a+b} = ab$$所以 $E[T] = ab$。
注意这里用了两个不同的 martingale 解同一个问题的两个不同方面: $B_t$ 求 hitting probability,$B_t^2 - t$ 求 expected hitting time。这和离散 Gambler’s Ruin 中用 $X_n$ 和 $X_n^2 - n$ 的思路完全一样。
7. Reflection Principle
问题: $T_a = \inf\{t > 0 : B_t \geq a\}$(首次到达 $a$ 的时间),$a > 0$。求 $P(T_a \leq t)$。
关键观察:
$$P(T_a \leq t) = P\left(\max_{0 \leq s \leq t} B_s \geq a\right)$$这是因为"在时间 $t$ 之前到达过 $a$“等价于"路径的最大值 $\geq a$"。
推导: 把事件 $B_t \geq a$ 按 $T_a$ 是否 $\leq t$ 来分:
$$P(B_t \geq a) = P(T_a \leq t) \cdot P(B_t \geq a \mid T_a \leq t)$$(如果 $T_a > t$,即在时间 $t$ 之前从未到过 $a$,那 $B_t \geq a$ 不可能发生。因为 BM 路径连续,不到 $a$ 就不可能超过 $a$。所以 $P(B_t \geq a, T_a > t) = 0$。)
现在算 $P(B_t \geq a \mid T_a \leq t)$。
给定 $T_a \leq t$,BM 在时间 $T_a$ 时到达了 $a$。由 Strong Markov Property,$(B_{T_a + s} - B_{T_a})_{s \geq 0}$ 是一个全新的 BM,独立于 $T_a$ 之前的信息。
所以:
$$P(B_t \geq a \mid T_a \leq t) = P(B_t - B_{T_a} \geq 0 \mid T_a \leq t)$$$B_t - B_{T_a}$ 是新 BM 在时间 $t - T_a$ 的值,分布是 $N(0, t - T_a)$。正态分布关于 0 对称,所以:
$$P(B_t - B_{T_a} \geq 0 \mid T_a \leq t) = \frac{1}{2}$$代回去:
$$P(B_t \geq a) = P(T_a \leq t) \cdot \frac{1}{2}$$所以:
$$P(T_a \leq t) = 2 \cdot P(B_t \geq a) = 2\Phi\left(-\frac{a}{\sqrt{t}}\right)$$(其中 $\Phi$ 是标准正态 CDF,$P(B_t \geq a) = P\left(\frac{B_t}{\sqrt{t}} \geq \frac{a}{\sqrt{t}}\right) = 1 - \Phi\left(\frac{a}{\sqrt{t}}\right) = \Phi\left(-\frac{a}{\sqrt{t}}\right)$)
Reflection Principle 的一个推论
$$P\left(\max_{0 \leq s \leq t} B_s \geq a\right) = P(T_a \leq t) = 2P(B_t \geq a) = P(|B_t| \geq a)$$所以 $\max_{0 \leq s \leq t} B_s$ 和 $|B_t|$ 有相同的分布。
这个结论很漂亮:BM 路径在 $[0, t]$ 上的最大值的分布,完全由终点 $B_t$ 的绝对值决定。
8. Phase 6 小结
| 概念 | 要点 |
|---|---|
| BM 定义 | $B_0=0$、独立增量、$B_t - B_s \sim N(0, t-s)$、连续路径 |
| BM 作为 MG | $B_t$ 是 MG,$B_t^2 - t$ 也是 MG |
| Continuous-time OST | 形式和离散版本相同,条件相同 |
| Gambler’s Ruin | $B_t$ → hitting prob $= a/(a+b)$;$B_t^2 - t$ → $E[T] = ab$ |
| Reflection Principle | $P(T_a \leq t) = 2P(B_t \geq a)$,$\max B_s \sim$ |
| 处处不可微 | 导数的方差 $\to \infty$ → 需要新的 calculus |