Brownian Motion

1. Definition

A process $(B_t)_{t\ge 0}$ is Brownian motion if:

$B_0=0$
It has independent increments
For every $s

$$ B_t-B_s\sim N(0,t-s) $$

Its sample paths are continuous almost surely

在布朗运动中，$B_t$ 可以取任意实数，即状态空间为 $(-\infty, +\infty)$。它不是一个固定的常数，而是一个随时间变化的随机变量。

方差 $\mathrm{Var}(B_t) = t$：这描述的是 $B_t$ 偏离中心点（0）的程度。方差等于 $t$ 意味着随着时间增加，粒子扩散得越来越远。

根据定义的第三条性质，在任何给定的时间 $t > 0$，状态 $B_t$ 服从正态分布：

$$B_t \sim N(0, t)$$

这意味着：

理论取值：在时刻 $t$，粒子的位置可以出现在坐标轴上的任何一点。
概率分布：取值在 $0$ 附近的概率最高。随着时间 $t$ 的流逝，方差 $t$ 变大，正态分布的钟形曲线变得更宽更扁平，$B_t$ 取到绝对值较大的数（即远离原点）的概率逐渐增加。

大写的 $B$ 通常代表整个随机过程 $(B_t)_{t \ge 0}$（即所有可能的连续轨迹的集合），而我们讨论“取值”时，通常是指在特定时刻 $t$ 的随机变量 $B_t$。

从条件 2 和 3 可以推出： $(B_{t_1}, B_{t_2}, \ldots, B_{t_k})$ 是 multivariate normal（多元正态）。满足这个性质的过程叫做 Gaussian Process。

Brownian Motion as a Gaussian Process

1. Definition

Theorem: Brownian Motion as a Gaussian Process A standard Brownian motion $(B_t)_{t \ge 0}$ is a Gaussian process. Its finite-dimensional distributions are completely characterized by its mean function and covariance function:

Mean function: $m(t) = \mathbb{E}[B_t] = 0$
Covariance function: $C(s, t) = \mathrm{Cov}(B_s, B_t) = \min(s, t)$

Explanation

高斯过程的严格定义要求其任意有限维边缘分布均为多元正态分布。对于布朗运动，给定任意时间序列 $0 < t_1 < t_2 < \dots < t_k$，可以通过其独立增量性质严格证明 $(B_{t_1}, \dots, B_{t_k})$ 服从多元正态分布。

由于增量 $B_{t_1}, B_{t_2} - B_{t_1}, \dots, B_{t_k} - B_{t_{k-1}}$ 是一组相互独立且服从一维正态分布的随机变量，而状态向量 $(B_{t_1}, \dots, B_{t_k})$ 可以表示为这些独立增量的线性变换，因此该状态向量必然服从多元正态分布。

关于协方差函数 $C(s, t) = \min(s, t)$ 的代数推导如下。假设 $0 \le s \le t$：

$$ \begin{aligned} \mathrm{Cov}(B_s, B_t) &= \mathbb{E}[(B_s - \mathbb{E}[B_s])(B_t - \mathbb{E}[B_t])] \\ &= \mathbb{E}[B_s B_t] \\ &= \mathbb{E}[B_s (B_s + B_t - B_s)] \\ &= \mathbb{E}[B_s^2 + B_s(B_t - B_s)] \\ &= \mathbb{E}[B_s^2] + \mathbb{E}[B_s(B_t - B_s)] \end{aligned} $$

根据布朗运动的独立增量性质，$B_s$（即 $B_s - B_0$）与 $B_t - B_s$ 相互独立。同时由于 $\mathbb{E}[B_t - B_s] = 0$，交叉项的期望为：

$$ \mathbb{E}[B_s(B_t - B_s)] = \mathbb{E}[B_s]\mathbb{E}[B_t - B_s] = 0 $$

根据定义，$\mathbb{E}[B_s^2] = \mathrm{Var}(B_s) = s$。因此，当 $s \le t$ 时，$\mathrm{Cov}(B_s, B_t) = s$。基于对称性，对任意给定的 $s, t \ge 0$，该结果可以推广为 $\mathrm{Cov}(B_s, B_t) = \min(s, t)$。

因为高斯过程由其一阶矩和二阶矩完全决定，上述均值和协方差函数唯一确定了布朗运动的全部有限维分布。

从 SRW 到 Brownian Motion

1. 缩放思想 (Scaling Idea)

基础模型：$X_n = \sum_{i=1}^n \varepsilon_i$ 这是一个标准的对称随机游走。想象你站在原点，每秒钟抛一次硬币（$\varepsilon_i$），正面就向右走1步（+1），反面就向左走1步（-1）。
时空缩放 (Time-Space Scaling)：$\frac{1}{\sqrt n}X_{\lfloor nt\rfloor}$ 为了从离散走向连续，我们需要“加快脚步”并“缩小步幅”。
- 时间加速：$\lfloor nt\rfloor$ 意味着在 $t$ 时间内，我们原本只走 $t$ 步，现在我们要走 $n \times t$ 步。当 $n$ 很大时，我们在极短的时间内走了无数步。
- 空间压缩：$\frac{1}{\sqrt n}$ 是为了平衡时间的加速。为什么除以 $\sqrt{n}$ 而不是 $n$？因为方差是线性累加的，而标准差是平方根累加的。如果空间除以 $n$，路径最后会缩成一条直线（大数定律）；只有除以 $\sqrt{n}$，随机性的波动才会被完美保留下来。

2. 极限分布 (Limiting Distribution)

中心极限定理的威力：由于 $\varepsilon_i$ 是独立同分布的，期望为0，方差为1。根据中心极限定理，大量独立随机变量的和趋向于正态分布。因此，缩放后的位置趋向于 $N(0,t)$。
方差的完美契合：每一步的方差是1。走了 $\lfloor nt\rfloor$ 步，总方差就是 $\lfloor nt\rfloor$。因为我们在空间上缩放了 $\frac{1}{\sqrt n}$，所以总方差要乘以 $(\frac{1}{\sqrt n})^2 = \frac{1}{n}$。最终方差计算为： $$\mathrm{Var}\left(\frac{1}{\sqrt n}X_{\lfloor nt\rfloor}\right) = \frac{\lfloor nt\rfloor}{n} \to t$$ 这正好匹配了标准布朗运动 $B(t)$ 的核心性质：$B(t)$ 服从正态分布，期望为0，方差为 $t$。

3. 核心意义 (Why this matters)

布朗运动不仅是一个纯粹的数学构造（连续时间、连续状态空间的马尔可夫过程），它更是所有具有有限方差的独立增量过程的“通用宏观极限”。

这就像物理学中的流体：微观上是无数个水分子在做杂乱无章的碰撞（随机游走），但在宏观尺度下，只要我们把时间和空间按照 $t$ 和 $\sqrt{t}$ 的比例缩小，我们看到的将是一个连续的、具有高度分形特征的流体运动（布朗运动）。

Brownian Motion’s Properties

Theorem A: Markov Property of Brownian Motion

let $(B_t)_{t \ge 0}$ be a standard Brownian motion and let $\mathcal{F}_t = \sigma(B_s : 0 \le s \le t)$ be the natural filtration representing the history of the process up to time $t$.

For any $r > t$ and any measurable function $f$:

$$E[f(B_r) \mid \mathcal{F}_t] = E[f(B_r) \mid B_t]$$

Equivalently, the conditional distribution of $B_r$ given the entire past $\mathcal{F}_t$ depends only on the current state $B_t$.

逻辑证明 (Reasoning)： 根据布朗运动的定义，其增量是独立的。对于任何 $s > 0$，未来位置可以表示为：$B_{t+s} = B_t + (B_{t+s} - B_t)$。由于增量 $(B_{t+s} - B_t)$ 独立于截止到 $t$ 时刻的所有历史信息 $\mathcal{F}_t$，因此给定 $B_t$ 后，历史轨迹对预测 $B_{t+s}$ 的分布没有贡献。

马尔可夫性要求时间 $t$ 必须是预先确定的。但在研究中，我们经常关注由路径本身决定的随机时间，例如“第一次到达某个水位 $a$ 的时刻”。这种时间被称为停时（Stopping Time）。

Definition: Stopping Time A random variable $T: \Omega \to [0, \infty]$ is a stopping time with respect to the filtration $(\mathcal{F}_t)_{t \ge 0}$ if for every $t \ge 0$, the event $\{T \le t\} \in \mathcal{F}_t$.

Theorem B: Strong Markov Property of Brownian Motion

Let $T$ be a stopping time such that $P(T < \infty) = 1$. Then the process $\tilde{B}_s = B_{T+s} - B_T$ ($s \ge 0$) is a standard Brownian motion independent of the pre-T sigma-field $\mathcal{F}_T$.

逻辑意义： 强马尔可夫性意味着布朗运动在停时 $T$ “重新开始”了。无论 $T$ 的取值如何（只要它不预见未来），布朗运动从该随机时刻起的后续行为依然像是一个全新的、从原点出发的布朗运动。

两者的区别与联系

特性	时间 $T$ 的性质	描述	关键用途
Markov Property	确定性数值 (Deterministic)	给定 $B_t$，未来独立于过去。	导出转移概率密度 (Transition density)。
Strong Markov Property	随机停时 (Stopping Time)	在随机时刻 $T$ 重新出发，依然是 BM。	证明反射原理 (Reflection Principle)，计算首达时间分布。

为什么布朗运动具有强马尔可夫性？ 并非所有马尔可夫过程都具有强马尔可夫性。布朗运动之所以具备此性质，是因为其路径是几乎处处连续的。这种连续性确保了在停时 $T$ 附近的极限行为是稳定的，从而允许我们将固定时间的性质推广到随机停时上。

如果没有强马尔可夫性，我们就无法通过对称性来证明反射原理（即 $P(\sup_{0\le s\le t} B_s \ge a) = 2P(B_t \ge a)$）。

Theorem C: Brownian Motion is continuous everywhere but not differentiable everywhere.

性质 C 描述了布朗运动最令人着迷且最具挑战性的几何特性：它是一条连续的“无限锯齿”。

1. 连续性与不可微性的对立 (Continuity vs. Differentiability)

根据定义条件 4，布朗运动的路径样本 $t \mapsto B_t$ 是几乎处处连续 (a.s. continuous) 的。这意味着粒子不会发生瞬间的位移跳跃。

然而，连续并不意味着平滑。在普通微积分中，我们定义导数为：

$$f'(t) = \lim_{\Delta t \to 0} \frac{f(t+\Delta t) - f(t)}{\Delta t}$$

对于布朗运动，我们考察这个差分商的统计特性。

2. 方差爆炸推导 (Variance Explosion)

根据布朗运动的平稳独立增量性质：

$$B_{t+\Delta t} - B_t \sim N(0, \Delta t)$$

设差分商为 $V_{\Delta t} = \frac{B_{t+\Delta t} - B_t}{\Delta t}$。利用正态分布的缩放性质：

$$\text{Var}(V_{\Delta t}) = \text{Var}\left( \frac{1}{\Delta t} (B_{t+\Delta t} - B_t) \right) = \frac{1}{(\Delta t)^2} \text{Var}(B_{t+\Delta t} - B_t)$$

将 $\text{Var}(B_{t+\Delta t} - B_t) = \Delta t$ 代入：

$$\text{Var}(V_{\Delta t}) = \frac{\Delta t}{(\Delta t)^2} = \frac{1}{\Delta t}$$

结论： 当 $\Delta t \to 0$ 时，$\text{Var}(V_{\Delta t}) \to \infty$。这意味着随着观测时间窗口的缩小，平均速度（斜率）的波动不仅没有趋于稳定，反而变得无穷大。因此，在任何点 $t$，极限 $\lim_{\Delta t \to 0} V_{\Delta t}$ 在概率意义上都不存在。

3. 几何直观与分形特征

布朗运动的路径具有自相似性 (Self-similarity)。如果你放大路径的任何一段，你会发现它看起来和整体一样剧烈震荡。

普通平滑函数：放大后会看起来像一条直线（线性逼近）。
布朗运动：无论放大多少倍，它依然是无数个细小的 V 型或柱状震荡。

这种性质在数学上由 Paley-Wiener-Zygmund Theorem 严格证明：在概率为 1 的情况下，布朗运动路径在任何点都不存在有限导数。

4. 对随机微积分的影响 (Need for Itô Calculus)

这种“处处不可微”性质导致了经典黎曼-斯蒂尔杰斯积分 (Riemann-Stieltjes integral) 的失效。在经典微积分中，微分项 $df = f'(t)dt$。但在布朗运动中，由于 $dB_t$ 的量级大约是 $\sqrt{dt}$（因为 $\text{Var}(dB_t) = dt$），所以：

$$(dB_t)^2 \approx dt$$

这就导致了 Itô’s Lemma 中出现了二阶导数项。如果你尝试用普通链式法则处理 $B_t^2$ 的微分，你会漏掉一个关键的常数项，因为布朗运动的二阶变差 (Quadratic Variation) 不为零。

Summary Table:

特征	经典函数 (Smooth)	布朗运动 (BM)
增量数量级	$\Delta f \sim \Delta t$	$\Delta B \sim \sqrt{\Delta t}$
差分商极限	收敛于 $f'(t)$	方差 $\to \infty$，不收敛
路径几何	局部线性	局部维数为 1.5 的分形
二阶变差	$[f, f]_t = 0$	$[B, B]_t = t$

Brownian Motion is Martingale

接下来的内容探讨了布朗运动在**鞅（Martingale）**理论中的地位。这是随机分析（Stochastic Analysis）的核心，也是后续研究伊藤积分（Itô Integral）的基础。

1. 命题 (Statement)

Brownian motion $(B_t)_{t\ge 0}$ is a martingale with respect to its natural filtration $(\mathcal F_t)$.

这里的 $\mathcal F_t = \sigma(B_u : 0 \le u \le t)$ 代表了到时间 $t$ 为止该过程产生的所有信息（即“历史”）。一个过程被称为鞅，通俗地说，就是它代表了一个**“公平游戏”**：给定现在的观测值，未来的期望值就等于现在的观测值。

2. 严格证明 (Verification)

For $s < t$, to show $(B_t)$ is a martingale, we must verify $\mathbb E[B_t \mid \mathcal F_s] = B_s$.

$$ \begin{aligned} \mathbb E[B_t \mid \mathcal F_s] &= \mathbb E[B_s + (B_t - B_s) \mid \mathcal F_s] \\ &= \mathbb E[B_s \mid \mathcal F_s] + \mathbb E[B_t - B_s \mid \mathcal F_s] \end{aligned} $$

证明基于以下三个核心性质：

可测性 (Measurability)：$B_s$ 是 $\mathcal F_s$-可测的。因为 $B_s$ 的值在时间 $s$ 已经确定了，所以 $\mathbb E[B_s \mid \mathcal F_s] = B_s$。
独立增量 (Independent Increments)：根据布朗运动的定义，$B_t - B_s$ 独立于历史信息 $\mathcal F_s$。因此，条件期望退化为无条件期望： $$\mathbb E[B_t - B_s \mid \mathcal F_s] = \mathbb E[B_t - B_s]$$
零均值 (Zero Mean)：根据定义，$B_t - B_s \sim N(0, t-s)$，所以其期望为 0。

结论：

$$\mathbb E[B_t \mid \mathcal F_s] = B_s + 0 = B_s$$

3. 为什么这个性质重要？

在随机微积分中，布朗运动作为鞅意味着它没有“漂移（Drift）”。如果你尝试对布朗运动进行赌博（积分），由于它是鞅，你不可能通过预判过去的路径来获得正的预期收益。

此外，布朗运动还衍生出了另外两个非常重要的鞅，它们在求解首达时间（First Passage Time）和定价模型中极具价值：

平方鞅 (Square Martingale)：$M_t = B_t^2 - t$ 是一个鞅。
指数鞅 (Exponential Martingale)：$M_t = \exp(\theta B_t - \frac{1}{2}\theta^2 t)$ 是一个鞅。

这两个衍生性质通常是于布朗运动计算题的重点。

在理解了 $B_t$ 是一个**鞅（Martingale）**之后，接下来这个性质揭示了布朗运动更深层的一面：虽然 $B_t$ 本身是无偏的（期望为 0），但它的“波动性”或“能量”（以平方形式表现）是随着时间线性增长的。

为了维持“公平博弈”的特性，我们必须从 $B_t^2$ 中减去这个随时间增长的趋势。

Statement

The process $M_t = B_t^2 - t$ is a martingale with respect to its natural filtration $\mathcal{F}_t$.

Verification

To prove $M_t$ is a martingale, we need to show that for any $s < t$:

$$\mathbb{E}[B_t^2 - t \mid \mathcal{F}_s] = B_s^2 - s$$

利用增量分解 $B_t = B_s + (B_t - B_s)$ 进行推导：

展开平方项 (Expand the Square):
$$B_t^2 = (B_s + (B_t - B_s))^2 = B_s^2 + 2B_s(B_t - B_s) + (B_t - B_s)^2$$
计算条件期望 (Conditional Expectation): 将其代入条件期望表达式中，并利用期望的线性性质：
$$\mathbb{E}[B_t^2 - t \mid \mathcal{F}_s] = \mathbb{E}[B_s^2 \mid \mathcal{F}_s] + 2\mathbb{E}[B_s(B_t - B_s) \mid \mathcal{F}_s] + \mathbb{E}[(B_t - B_s)^2 \mid \mathcal{F}_s] - \mathbb{E}[t \mid \mathcal{F}_s]$$
逐项化简 (Term-by-term Simplification):
- 第一项：$B_s^2$ 是 $\mathcal{F}_s$-可测的，所以 $\mathbb{E}[B_s^2 \mid \mathcal{F}_s] = B_s^2$。
- 第二项：$B_s$ 是 $\mathcal{F}_s$-可测的，可以提到期望符号外。由于增量 $B_t - B_s$ 与 $\mathcal{F}_s$ 独立且均值为 0： $$2B_s \mathbb{E}[B_t - B_s \mid \mathcal{F}_s] = 2B_s \cdot 0 = 0$$
- 第三项：$(B_t - B_s)^2$ 与 $\mathcal{F}_s$ 独立。根据布朗运动定义，$B_t - B_s \sim N(0, t-s)$。对于服从 $N(0, \sigma^2)$ 的随机变量，其二阶矩 $\mathbb{E}[X^2] = \sigma^2$： $$\mathbb{E}[(B_t - B_s)^2 \mid \mathcal{F}_s] = \mathbb{E}[(B_t - B_s)^2] = t - s$$
- 第四项：$t$ 是确定性常数，$\mathbb{E}[t \mid \mathcal{F}_s] = t$。
合并结果 (Conclusion):
$$\mathbb{E}[B_t^2 - t \mid \mathcal{F}_s] = B_s^2 + 0 + (t - s) - t = B_s^2 - s$$
证明完毕。

核心意义

漂移补偿 (Drift Compensation)： $B_t^2$ 本身不是鞅，因为 $\mathbb{E}[B_t^2] = t$。随着时间推移，$B_t^2$ 的平均值在不断增加（这是一个向上飘移的倾向）。通过减去 $t$，我们抵消了这个系统性的增长。$t$ 在这里被称为 Compensator。
二次变差 (Quadratic Variation)：这个鞅性质实际上暗示了布朗运动的一个关键特征：它的二次变差 $[B, B]_t = t$。在随机分析中，如果我们知道一个连续鞅 $M_t$ 满足 $M_t^2 - t$ 也是鞅，那么根据 Lévy’s Characterization，这个过程 $M_t$ 必然是布朗运动。

在随机分析的计算中“$B_s$ 是 $\mathcal{F}_s$-可测的” 意味着在给定时刻 $s$ 的信息时，$B_s$ 不再是“随机”的，而是一个已知的确定值。

所以在计算条件期望时，我们可以直接把 $B_s$ 或 $B_s^2$ 像常数一样提到期望符号 $\mathbb{E}[\cdot \mid \mathcal{F}_s]$ 之外。

$$\mathbb{E}[B_s \cdot X \mid \mathcal{F}_s] = B_s \cdot \mathbb{E}[X \mid \mathcal{F}_s]$$

为什么 $E[(B_t - B_s)^2 | \mathcal{F}_s] = E[(B_t - B_s)^2] = t - s$？

这一步推导并非意指“方差的期望等于方差”，而是在利用布朗运动（BM）的**独立增量（Independent Increments）**性质来简化条件期望。

这里有三个核心逻辑步骤：

1. 独立性导致的“条件”失效 (Independence)

Theorem: Independence and Conditional Expectation If a random variable $X$ is independent of a $\sigma$-algebra $\mathcal{G}$, then:

$$E[X \mid \mathcal{G}] = E[X]$$

在布朗运动中，增量 $B_t - B_s$ 独立于历史信息 $\mathcal{F}_s$。因此，增量的平方 $(B_t - B_s)^2$ 也必然独立于 $\mathcal{F}_s$。这意味着：即便你知道了时刻 $s$ 之前发生的所有事情，也不会改变你对未来增量平方值的“期望预测”。 所以第一个等号成立：

$$E[(B_t - B_s)^2 \mid \mathcal{F}_s] = E[(B_t - B_s)^2]$$

2. 二阶矩与方差的关系 (Second Moment and Variance)

对于任何随机变量 $X$，其方差定义为 $\mathrm{Var}(X) = E[X^2] - (E[X])^2$。对于布朗运动的增量 $X = B_t - B_s$：

我们已知 $E[B_t - B_s] = 0$。
因此，$\mathrm{Var}(B_t - B_s) = E[(B_t - B_s)^2] - 0^2 = E[(B_t - B_s)^2]$。

也就是说，增量平方的期望，在数值上正好等于该增量的方差。

3. 为什么结果是 $t-s$？

这来自于布朗运动定义中的**平稳增量（Stationary Increments）**性质：

Property: Distribution of Increments For any $s < t$:

$$B_t - B_s \sim N(0, t - s)$$

根据正态分布的性质，该随机变量的方差就是其分布参数中的第二个项：

$$\mathrm{Var}(B_t - B_s) = t - s$$

总结 (Summary)

你看到的这个等式实际上是在说：

左边 $E[(B_t - B_s)^2 \mid \mathcal{F}_s]$：在已知历史的情况下，预测未来波动的平方。
中间 $E[(B_t - B_s)^2]$：由于未来波动是独立的，这等同于无条件的平均预测。
右边 $t-s$：根据定义，这个平均预测的数值大小正好等于时间跨度。

这一步是证明 $B_t^2 - t$ 是鞅（Martingale）过程中最关键的一环，它解释了为什么要减去 $t$——因为 $B_t^2$ 包含了一个随时间线性增长的期望值（即方差）。

Continuous-Time Stopping Time

从固定时间 $t$ 转向随机时间 $T$，是随机分析中的一个飞跃。停时（Stopping Time） 的核心在于：你是否决定停止，只能取决于你目前掌握的信息，而不能预知未来。

1. 形式化定义 (Formal Definition)

Definition: Stopping Time A random variable $T: \Omega \to [0, \infty]$ is called a stopping time with respect to the filtration $(\mathcal{F}_t)_{t \ge 0}$ if for every $t \ge 0$:

$$\{ \omega \in \Omega : T(\omega) \le t \} \in \mathcal{F}_t$$

符号	数学定义	直观理解
$\Omega$	样本空间 (Sample Space)	所有可能路径的总体
$\omega$	样本点 (Outcome)	某一条具体的随机路径
$T(\omega)$	随机变量的值	在路径 $\omega$ 下，发生停止的具体时间点
$\mathcal{F}_t$	$\sigma$-代数 ($\sigma$-algebra)	到时刻 $t$ 为止我们掌握的全部“历史情报”
$\{T \le t\}$	事件 (Event)	“停止动作已经在 $t$ 之前发生”这个实验结果集

为什么使用 $\{T \le t\}$ 而非 $\{T = t\}$？

在连续时间中，$P(T = t) = 0$ 对大多数 $t$ 成立（因为 $T$ 通常是连续分布的），所以用 ${T = t}$ 不方便。${T \leq t}$ 问的是"到时间 $t$ 为止，$T$ 是否已经发生了"——这和离散情况的精神是一样的。

在离散时间（Discrete Time）中， $\{T \le t\}$ 和 $\{T = t\}$ 这两个条件是等价的。但在连续时间下，情况有所不同：布朗运动是连续路径。如果我们定义 $T$ 为第一次到达水位 $a$ 的时间，那么 $T$ 取到任何一个精确数值 $t$（如 $\pi$ 秒）的概率通常是 0。事件 $\{T = t\}$ 描述的是一个瞬时点，而 $\{T \le t\}$ 描述的是一个区间。在连续时间流 $(\mathcal{F}_t)$ 中，使用不等式可以确保我们捕捉到过程在 $[0, t]$ 期间的所有累积行为。

Continuous-Time OST

在离散时间中，我们知道一个鞅（公平游戏）在停时 $T$ 停止后，其期望收益依然等于初始值。而在连续时间下，由于路径是连续的且时间是无限的，我们需要更严格的条件来保证这种“公平性”不会在极限处溢出。

1. 定理陈述 (Statement)

Optional Stopping Theorem (Continuous Time) Let $(X_t)_{t \ge 0}$ be a continuous-time martingale with continuous paths, and let $T$ be a stopping time with $P(T < \infty) = 1$. If:

$\mathbb{E}[|X_T|] < \infty$
$\lim_{t \to \infty} \mathbb{E}[|X_t| \mathbf{1}_{\{T > t\}}] = 0$

Then:

$$\mathbb{E}[X_T] = \mathbb{E}[X_0]$$

核心逻辑：

这个定理回答了一个基本问题：“如果我根据目前看到的信息决定什么时候停止博弈，我的预期收益会改变吗？” 如果上述条件满足，答案是：不会。你无法通过选择一个聪明的停时 $T$（只要它不预见未来）来把一个均值为 0 的过程变成均值非 0。

2. 条件的直观解释 (Why these conditions?)

为什么不能直接说 $\mathbb{E}[X_T] = \mathbb{E}[X_0]$？因为如果没有限制，你可以构建出诡异的策略。

$P(T < \infty) = 1$：你必须保证博弈最终会停止。如果你允许博弈永远进行下去（例如：不赢到 100 万绝不停止），那么 $X_T$ 可能根本没有定义。
$\lim_{t \to \infty} \mathbb{E}[|X_t| \mathbf{1}_{\{T > t\}}] = 0$：这是最关键的条件。它保证了那些“还没停止的路径”在时间趋于无穷时，其携带的数值贡献趋于 0。
- 如果这个条件不满足，说明在非常遥远的未来，还有一些极低概率但数值极大的路径（例如倍投策略中的巨额亏损），它们会破坏整体期望的平衡。

3. 实际应用准则 (Practical Criteria)

在 STA447 的题目中，直接验证上面的极限条件通常很麻烦。我们通常使用以下两个更简单的充分条件：

A. 过程在停止前是有界的 (Bounded before stopping)

If there exists a constant $M < \infty$ such that $|X_{t \wedge T}| \le M$ for all $t \ge 0$ (almost surely).

例子：考虑布朗运动 $B_t$ 在到达 $a$ 或 $b$（$a < 0 < b$）时停止。由于路径在停止前始终被困在 $[a, b]$ 区间内，它是一致有界的。此时可以直接应用 OST。

B. 一致可积性 (Uniform Integrability, UI)

If the martingale $\{X_t\}_{t \ge 0}$ is uniformly integrable.

一致可积是一个比“有界”更宽泛的数学性质，它确保了我们可以交换极限符号与期望符号（即应用勒贝格控制收敛定理）。

Continuous-Time Gambler’s Ruin

问题： $(B_t)_{t \geq 0}$ 是 BM。$a, b > 0$。$T = \inf\{t \geq 0 : B_t = -a \text{ or } B_t = b\}$。求 $P(B_T = b)$ 和 $E[T]$。

Part 1：求 $P(B_T = b)$

用 $B_t$ 这个 martingale。

在 $T$ 之前，$-a \leq B_t \leq b$（还没 exit），所以 $|B_t| \leq \max(a, b)$，有界。OST 适用。

$$E[B_T] = E[B_0] = 0$$

$B_T$ 只能取 $b$ 或 $-a$：

$$b \cdot P(B_T = b) + (-a) \cdot P(B_T = -a) = 0$$

又 $P(B_T = b) + P(B_T = -a) = 1$，设 $p = P(B_T = b)$：

$$bp - a(1 - p) = 0$$$$bp - a + ap = 0$$$$p(a + b) = a$$$$p = \frac{a}{a + b}$$

Part 2：求 $E[T]$

用 $M_t = B_t^2 - t$ 这个 martingale。

需要验证 OST 条件。这比 Part 1 更微妙，因为 $M_t$ 在 $T$ 之前不是有界的（$B_t^2$ 有界，但 $-t$ 可以任意负）。

处理方式：先证 $E[T] < \infty$。

怎么证？考虑一个固定的时间 $T_0$。从 $(-a, b)$ 区间的任意起点出发，BM 在时间 $T_0$ 内到达 $-a$ 或 $b$ 的概率有一个正的下界 $\eta > 0$（这是因为 $B_{T_0} \sim N(B_0, T_0)$，正态分布的尾概率始终为正）。

所以每过 $T_0$ 时间，有至少 $\eta$ 的概率停下来。这意味着：

$$P(T > kT_0) \leq (1 - \eta)^k$$

所以 $T$ 有指数衰减的尾概率，$E[T] < \infty$。

有了 $E[T] < \infty$，可以证明 $E[|M_t| \cdot \mathbf{1}(T > t)] \to 0$（因为 $|M_t| \leq \max(a,b)^2 + t$，而 $P(T > t)$ 指数衰减），OST 条件满足。

应用 OST：

$$E[M_T] = E[M_0] = B_0^2 - 0 = 0$$$$E[B_T^2 - T] = 0$$$$E[B_T^2] = E[T]$$

计算 $E[B_T^2]$：

$$E[B_T^2] = b^2 \cdot P(B_T = b) + (-a)^2 \cdot P(B_T = -a)$$$$= b^2 \cdot \frac{a}{a+b} + a^2 \cdot \frac{b}{a+b}$$$$= \frac{ab^2 + a^2 b}{a+b} = \frac{ab(a+b)}{a+b} = ab$$

所以 $E[T] = ab$。

注意这里用了两个不同的 martingale 解同一个问题的两个不同方面： $B_t$ 求 hitting probability，$B_t^2 - t$ 求 expected hitting time。这和离散 Gambler’s Ruin 中用 $X_n$ 和 $X_n^2 - n$ 的思路完全一样。

7. Reflection Principle

问题： $T_a = \inf\{t > 0 : B_t \geq a\}$（首次到达 $a$ 的时间），$a > 0$。求 $P(T_a \leq t)$。

关键观察：

$$P(T_a \leq t) = P\left(\max_{0 \leq s \leq t} B_s \geq a\right)$$

这是因为"在时间 $t$ 之前到达过 $a$“等价于"路径的最大值 $\geq a$"。

推导： 把事件 $B_t \geq a$ 按 $T_a$ 是否 $\leq t$ 来分：

$$P(B_t \geq a) = P(T_a \leq t) \cdot P(B_t \geq a \mid T_a \leq t)$$

（如果 $T_a > t$，即在时间 $t$ 之前从未到过 $a$，那 $B_t \geq a$ 不可能发生。因为 BM 路径连续，不到 $a$ 就不可能超过 $a$。所以 $P(B_t \geq a, T_a > t) = 0$。）

现在算 $P(B_t \geq a \mid T_a \leq t)$。

给定 $T_a \leq t$，BM 在时间 $T_a$ 时到达了 $a$。由 Strong Markov Property，$(B_{T_a + s} - B_{T_a})_{s \geq 0}$ 是一个全新的 BM，独立于 $T_a$ 之前的信息。

所以：

$$P(B_t \geq a \mid T_a \leq t) = P(B_t - B_{T_a} \geq 0 \mid T_a \leq t)$$

$B_t - B_{T_a}$ 是新 BM 在时间 $t - T_a$ 的值，分布是 $N(0, t - T_a)$。正态分布关于 0 对称，所以：

$$P(B_t - B_{T_a} \geq 0 \mid T_a \leq t) = \frac{1}{2}$$

代回去：

$$P(B_t \geq a) = P(T_a \leq t) \cdot \frac{1}{2}$$

所以：

$$P(T_a \leq t) = 2 \cdot P(B_t \geq a) = 2\Phi\left(-\frac{a}{\sqrt{t}}\right)$$

（其中 $\Phi$ 是标准正态 CDF，$P(B_t \geq a) = P\left(\frac{B_t}{\sqrt{t}} \geq \frac{a}{\sqrt{t}}\right) = 1 - \Phi\left(\frac{a}{\sqrt{t}}\right) = \Phi\left(-\frac{a}{\sqrt{t}}\right)$）

Reflection Principle 的一个推论

$$P\left(\max_{0 \leq s \leq t} B_s \geq a\right) = P(T_a \leq t) = 2P(B_t \geq a) = P(|B_t| \geq a)$$

所以 $\max_{0 \leq s \leq t} B_s$ 和 $|B_t|$ 有相同的分布。

这个结论很漂亮：BM 路径在 $[0, t]$ 上的最大值的分布，完全由终点 $B_t$ 的绝对值决定。

8. Phase 6 小结

概念	要点
BM 定义	$B_0=0$、独立增量、$B_t - B_s \sim N(0, t-s)$、连续路径
BM 作为 MG	$B_t$ 是 MG，$B_t^2 - t$ 也是 MG
Continuous-time OST	形式和离散版本相同，条件相同
Gambler’s Ruin	$B_t$ → hitting prob $= a/(a+b)$；$B_t^2 - t$ → $E[T] = ab$
Reflection Principle	$P(T_a \leq t) = 2P(B_t \geq a)$，$\max B_s \sim$
处处不可微	导数的方差 $\to \infty$ → 需要新的 calculus

Brownian Motion#

1. Definition#

Brownian Motion as a Gaussian Process#

1. Definition#

Explanation#

从 SRW 到 Brownian Motion#

1. 缩放思想 (Scaling Idea)#

2. 极限分布 (Limiting Distribution)#

3. 核心意义 (Why this matters)#

Brownian Motion’s Properties#

Theorem A: Markov Property of Brownian Motion#

Theorem B: Strong Markov Property of Brownian Motion#

两者的区别与联系#

Theorem C: Brownian Motion is continuous everywhere but not differentiable everywhere.#

1. 连续性与不可微性的对立 (Continuity vs. Differentiability)#

2. 方差爆炸推导 (Variance Explosion)#

3. 几何直观与分形特征#

4. 对随机微积分的影响 (Need for Itô Calculus)#

Brownian Motion is Martingale#

1. 命题 (Statement)#

2. 严格证明 (Verification)#

3. 为什么这个性质重要？#

Statement#

Verification#

核心意义#

为什么 $E[(B_t - B_s)^2 | \mathcal{F}_s] = E[(B_t - B_s)^2] = t - s$？#

1. 独立性导致的“条件”失效 (Independence)#

2. 二阶矩与方差的关系 (Second Moment and Variance)#

3. 为什么结果是 $t-s$？#

总结 (Summary)#

Continuous-Time Stopping Time#

1. 形式化定义 (Formal Definition)#

为什么使用 $\{T \le t\}$ 而非 $\{T = t\}$？#

Continuous-Time OST#

1. 定理陈述 (Statement)#

核心逻辑：#

2. 条件的直观解释 (Why these conditions?)#

3. 实际应用准则 (Practical Criteria)#

A. 过程在停止前是有界的 (Bounded before stopping)#

B. 一致可积性 (Uniform Integrability, UI)#

Continuous-Time Gambler’s Ruin#

Part 1：求 $P(B_T = b)$#

Part 2：求 $E[T]$#

7. Reflection Principle#

Reflection Principle 的一个推论#

8. Phase 6 小结#

Brownian Motion

1. Definition

Brownian Motion as a Gaussian Process

1. Definition

Explanation

从 SRW 到 Brownian Motion

1. 缩放思想 (Scaling Idea)

2. 极限分布 (Limiting Distribution)

3. 核心意义 (Why this matters)

Brownian Motion’s Properties

Theorem A: Markov Property of Brownian Motion

Theorem B: Strong Markov Property of Brownian Motion

两者的区别与联系

Theorem C: Brownian Motion is continuous everywhere but not differentiable everywhere.

1. 连续性与不可微性的对立 (Continuity vs. Differentiability)

2. 方差爆炸推导 (Variance Explosion)

3. 几何直观与分形特征

4. 对随机微积分的影响 (Need for Itô Calculus)

Brownian Motion is Martingale

1. 命题 (Statement)

2. 严格证明 (Verification)

3. 为什么这个性质重要？

Statement

Verification

核心意义

为什么 $E[(B_t - B_s)^2 | \mathcal{F}_s] = E[(B_t - B_s)^2] = t - s$？

1. 独立性导致的“条件”失效 (Independence)

2. 二阶矩与方差的关系 (Second Moment and Variance)

3. 为什么结果是 $t-s$？

总结 (Summary)

Continuous-Time Stopping Time

1. 形式化定义 (Formal Definition)

为什么使用 $\{T \le t\}$ 而非 $\{T = t\}$？

Continuous-Time OST

1. 定理陈述 (Statement)

核心逻辑：

2. 条件的直观解释 (Why these conditions?)

3. 实际应用准则 (Practical Criteria)

A. 过程在停止前是有界的 (Bounded before stopping)

B. 一致可积性 (Uniform Integrability, UI)

Continuous-Time Gambler’s Ruin

Part 1：求 $P(B_T = b)$

Part 2：求 $E[T]$

7. Reflection Principle

Reflection Principle 的一个推论

8. Phase 6 小结