引言:一个根本的数学困境
想象你站在地球表面的赤道上,手里拿着一根箭,箭头指向正北方。现在,你带着这根箭沿着赤道向东行走,始终保持箭头指向"正北方"(相对于你当前的地理位置)。当你绕地球一周回到起点时,会发生什么?
这个看似简单的问题揭示了微分几何中一个深刻的困境:如何比较流形上不同点的切向量?

图1:球面上的平行移动示意图。红色曲线表示移动路径,绿色箭头表示平行移动的向量。绕赤道一周后,向量发生了旋转!
在欧几里得空间中,我们从来不需要担心这个问题。如果在 $\mathbb{R}^n$ 的两个不同点 $p$ 和 $q$ 各有一个向量 $v_p$ 和 $v_q$,我们可以直接平移 $v_p$ 到 $q$ 点,然后和 $v_q$ 比较。这是因为欧氏空间有一个自然的平行性——所有点的切空间都可以自然地等同起来。

图2:在平面上,不同点的切向量可以直接平移比较。每个点上的红色箭头代表同一个向量平移后的结果。
但在一般的流形上,比如球面上,没有这种自然的等同。每一点的切空间都是一个独立的向量空间,点与点之间的切空间之间没有任何天然的联系。这就是联络概念要解决的根本问题:如何在流形上建立不同点切空间之间的"联络",从而能够定义方向导数、平行移动,并最终定义曲率。
联络的概念是现代微分几何的基石,它的历史可以追溯到19世纪中叶。Riemann 在1854年的著名演讲《论几何基础的假设》中已经隐含了联络的思想,但严格的数学表述则是由Levi-Civita、Christoffel、Ricci、Cartan等人在后续几十年中逐步完善的。本文将带你踏上一段从直观到严格的数学之旅,深入理解这个优美而深刻的数学概念。
第一章:预备知识——流形与切丛
在深入联络的概念之前,我们需要一些基本的几何语言。如果你已经熟悉流形和切丛的概念,可以快速浏览这一章。
1.1 什么是流形?
直观地说,流形是一个局部看起来像欧氏空间,但整体可能有复杂弯曲结构的几何对象。
- 一维流形:曲线,如圆、线段
- 二维流形:曲面,如球面、环面、甜甜圈表面
- 高维流形:难以直接可视化,但数学定义同样适用
形式化定义:一个 $n$ 维拓扑流形是一个豪斯多夫空间 $M$,使得对于任意 $p \in M$,存在一个开邻域 $U \subset M$ 和同胚映射 $\phi: U \to V$,其中 $V$ 是 $\mathbb{R}^n$ 的开子集。$(U, \phi)$ 称为一个坐标卡或坐标图。
1.2 切空间与切向量
在 $\mathbb{R}^n$ 中,切向量的概念很直观:它是一个指向某个方向的箭头。但在流形上,我们需要更仔细地定义切向量。
有几种等价的定义方式:
定义1(方向导数视角):$p$ 点的切向量是作用在函数上的方向导算子。如果 $v$ 是一个切向量,$\gamma: (-\varepsilon, \varepsilon) \to M$ 是一条满足 $\gamma(0) = p$ 的曲线,那么: $$ v[f] = \left.\frac{d}{dt}\right|_{t=0} f(\gamma(t)) $$
定义2(等价类视角):$p$ 点的切向量是所有通过 $p$ 点的曲线的等价类,其中两条曲线 $\gamma_1, \gamma_2$ 等价当且仅当在任意坐标下它们在 $p$ 点的导数相等。
$p$ 点的所有切向量构成的向量空间称为切空间,记作 $T_p M$。
1.3 切丛:所有切空间的集合
现在,我们要把每一点的切空间"捆绑"在一起:
定义:流形 $M$ 的切丛 $TM$ 是所有切空间的并集: $$ TM = \bigcup_{p \in M} T_p M = {(p, v) : p \in M, v \in T_p M} $$
切丛本身也是一个流形!如果 $M$ 是 $n$ 维的,那么 $TM$ 是 $2n$ 维的。这可以通过局部坐标看出:在局部坐标 $(x^1, \ldots, x^n)$ 下,切向量可以表示为: $$ v = \sum_{i=1}^n v^i \left.\frac{\partial}{\partial x^i}\right|_p $$ 因此切丛的局部坐标是 $(x^1, \ldots, x^n, v^1, \ldots, v^n)$。

图3:切丛示意图。蓝色曲面是流形 $M$,每一点都有一个切空间(红色和绿色箭头表示切空间的基向量)。切丛是所有这些切空间的"集合"。
切丛是一个纤维丛的例子:
- 底空间:流形 $M$
- 纤维:每一点的切空间 $T_p M \cong \mathbb{R}^n$
- 投影映射:$\pi: TM \to M, \pi(p, v) = p$
理解纤维丛的结构对于理解联络的现代定义至关重要。
第一章附录:核心概念详解——写给零基础的读者
如果你觉得上面的定义有些抽象,别担心!这一节我会用最通俗的语言和生活中的例子来解释这些概念。你可以把这一节当作一个"概念词典",需要的时候随时回来查阅。
概念1:流形——用地图来描述地球
核心思想:流形就是"局部平、整体弯"的东西。
想象一下地球表面。如果你站在一个小区域内(比如一个城市),你会感觉地面是平的。这就是为什么我们可以用平面地图来表示局部区域。但如果你走得更远,你会发现地球实际上是弯曲的——这是一个球面。
这就是流形的本质:在足够小的范围内,它看起来像平直的欧氏空间。
类比:
- 地球表面是二维流形:局部看起来像平面($\mathbb{R}^2$),但整体是球面
- 一根绳子(圆)是一维流形:局部看起来像直线($\mathbb{R}^1$),但整体是圆
- 甜甜圈表面是二维流形:局部看起来像平面,但整体有洞
坐标卡和图册:
因为流形整体是弯曲的,我们无法用一张平面地图完美地表示它。解决办法是:使用多张局部地图,每张覆盖一部分区域。
- 一张局部地图(比如"亚洲地图")就是一个坐标卡
- 所有地图的集合(世界地图册)就是一个图册
数学上,坐标卡是一个配对 $(U, \phi)$,其中 $U$ 是流形上的一个开集(地图覆盖的区域),$\phi: U \to \mathbb{R}^n$ 是坐标映射(把曲面上的点对应到平面上的坐标)。
概念2:切空间和切向量——“紧贴"曲面的箭头
直观理解:切向量是"紧贴着曲面、沿着曲面走"的箭头,而不是"穿过"曲面。
想象一个球体:
- 在球面上某一点放一支箭
- 如果箭指向球体内部或指向球体外部,它不是切向量
- 如果箭紧贴着球面,像是沿着球面滑动的方向,它就是切向量
为什么叫"切”? 来自几何中的"切线"概念——一条直线与圆/球在一点相切,意味着它们在该点"刚好接触"而不穿过。
切空间 $T_p M$:在某一点 $p$,所有可能的"紧贴曲面"的箭头构成的集合,这就是一个向量空间。
例子:
- 在地球表面的赤道上,“正东方”、“正北方"都是切向量
- “指向地心"或"指向天空"不是切向量(它们垂直于地表)
为什么切向量这么抽象?
在 $\mathbb{R}^n$ 中,切向量很简单——就是一个箭头 $(v^1, v^2, \ldots, v^n)$。但在流形上,我们不能直接说"向量从点 $p$ 指向点 $q$",因为两点之间的"直线"可能不在流形上!
这就是为什么我们需要用曲线的等价类或方向导数算子来定义切向量——这两种定义都避免了"离开流形"的问题。
概念3:向量场——每一点都有一个箭头
直观理解:向量场就是在流形的每一点都放一个箭头。
生活中的例子:
- 风力图:在地图的每一点标一个箭头表示风向和风速
- 流体速度场:在河流的每一点标一个箭头表示水流的速度和方向
数学上,向量场是一个函数 $X: M \to TM$,满足 $\pi \circ X = \text{id}_M$。换句话说,对于每一点 $p$,指定一个切向量 $X(p) \in T_p M$。
坐标表示:在局部坐标 $(x^1, \ldots, x^n)$ 下,向量场可以写成: $$ X = \sum_{i=1}^n X^i(x) \frac{\partial}{\partial x^i} $$ 其中 $X^i(x)$ 是函数,给出了箭头在第 $i$ 个坐标方向的分量。
概念4:纤维丛——“头发"的几何
核心思想:在底空间的每一点上"长一根头发”,所有这些头发的集合就是纤维丛。
类比:
- 底空间:人的头皮(曲面)
- 纤维:每根头发(线段)
- 总空间:所有头发的集合(丛)
切丛是特殊的纤维丛:
- 底空间:流形 $M$
- 每一根"头发”(纤维):该点的切空间 $T_p M$
- 每一根"头发"都是一个向量空间(不是线段,而是整个 $\mathbb{R}^n$)
局部平凡化:这是纤维丛的一个重要性质。它说的是:在小范围内,纤维丛看起来像"底空间 × 纤维”。
类比:在头皮的一小块区域上,所有头发可以"梳平"成规则的网格。
概念5:李括号——向量场的"交换子"
问题:两个向量场 $X$ 和 $Y$ 可以"交换"吗?即:先沿 $X$ 走一小段,再沿 $Y$ 走一小段,和先沿 $Y$ 走一小段,再沿 $X$ 走一小段,结果一样吗?
直观理解:在平面上,顺序不重要。但在流形上,顺序可能重要!
例子:在球面上
- 从赤道某点出发,向北走100公里,再向东走100公里
- 从同一点出发,向东走100公里,再向北走100公里
- 这两个终点不同!
李括号 $[X, Y]$ 测量的就是"不交换的程度": $$ [X, Y] = XY - YX $$
坐标计算:如果 $X = \sum_i X^i \frac{\partial}{\partial x^i}$,$Y = \sum_j Y^j \frac{\partial}{\partial x^j}$,那么: $$ [X, Y] = \sum_{i,j} \left(X^i \frac{\partial Y^j}{\partial x^i} - Y^i \frac{\partial X^j}{\partial x^i}\right) \frac{\partial}{\partial x^j} $$
概念6:张量——“多线性"的对象
直观理解:张量是一个可以接收多个向量、输出一个数的"机器”,而且对每个输入都是线性的。
分类:
- 标量(0阶张量):一个数,如温度 $T = 25^\circ$C
- 向量(1阶张量):需要一个方向输入,如速度 $v$
- 度量张量(2阶张量):需要两个向量输入,输出它们的内积 $g(X, Y)$
- 黎曼曲率张量(4阶张量):需要三个向量输入,输出一个向量 $R(X, Y)Z$
为什么叫"张量"? “Tensor"来自拉丁语"tendre”(拉伸),最初用来描述材料内部的应力——应力需要同时考虑力和受力面的方向。
坐标变换行为:张量的关键特征是在坐标变换下的变换规律。$(k, l)$ 型张量 $T$ 在坐标变换下的分量变换为: $$ \tilde{T}^{i_1 \cdots i_k}{j_1 \cdots j_l} = \sum \frac{\partial \tilde{x}^{i_1}}{\partial x^{a_1}} \cdots \frac{\partial \tilde{x}^{i_k}}{\partial x^{a_k}} \frac{\partial x^{b_1}}{\partial \tilde{x}^{j_1}} \cdots \frac{\partial x^{b_l}}{\partial \tilde{x}^{j_l}} T^{a_1 \cdots a_k}{b_1 \cdots b_l} $$
这个复杂的公式说的是:张量的分量会随坐标变化,但按照特定的规则变化,使得整体的几何意义不变。
概念7:度量——测量长度和角度的尺子
直观理解:度量(或度量张量)告诉我们:
- 一个向量的长度是多少
- 两个向量之间的夹角是多少
- 两点之间的距离是多少
例子:
- 在欧氏空间 $\mathbb{R}^2$ 中,标准度量是 $ds^2 = dx^2 + dy^2$
- 在极坐标中,这是 $ds^2 = dr^2 + r^2 d\theta^2$
- 在球面上,这是 $ds^2 = d\theta^2 + \sin^2\theta , d\phi^2$
度量的分量:$g_{ij} = \langle \frac{\partial}{\partial x^i}, \frac{\partial}{\partial x^j} \rangle$
长度公式:向量 $v = \sum_i v^i \frac{\partial}{\partial x^i}$ 的长度是: $$ |v| = \sqrt{\sum_{i,j} g_{ij} v^i v^j} $$
概念8:1-形式——“对偶"的向量
直观理解:如果向量是"箭头”,那么1-形式就是"测量箭头的尺子"。
数学定义:1-形式是一个线性函数 $\omega: T_p M \to \mathbb{R}$,它"吃掉"一个向量,“吐出"一个数。
例子:
- 在 $\mathbb{R}^2$ 中,$dx$ 是一个1-形式:它测量向量在 $x$ 方向的分量
- 对于向量 $v = (3, 4)$,$dx(v) = 3$,$dy(v) = 4$
对偶空间:所有1-形式构成的集合称为余切空间,记作 $T_p^{\ast} M$。它与切空间 $T_p M$ 是"对偶"关系。
概念9:拉回与推前——“映射"向量的两种方式
当我们有一个映射 $f: M \to N$ 时,如何"移动"向量或形式?
推前(Pushforward,记作 $f_*$):把 $M$ 上的向量推到 $N$ 上
- 这很自然:曲线映射到曲线,切向量映射到切向量
拉回(Pullback,记作 $f^{\ast}$):把 $N$ 上的1-形式拉到 $M$ 上
- 这是因为1-形式的定义域在 $N$,我们需要把它"拉回"到 $M$ 上才能用
概念10:外微分与楔积——微分形式的"微积分”
微分形式:1-形式的推广,可以理解为"积分的被积函数”。
外微分 $d$:把 $k$-形式变成 $(k+1)$-形式的算子
- $df$:函数 $f$ 的微分(1-形式)
- $d(\omega_1 \wedge \omega_2) = d\omega_1 \wedge \omega_2 + (-1)^k \omega_1 \wedge d\omega_2$
楔积 $\wedge$:微分形式的"乘法",满足:
- $\omega \wedge \eta = (-1)^{kl} \eta \wedge \omega$($\omega$ 是 $k$-形式,$\eta$ 是 $l$-形式)
- $d \circ d = 0$(外微分的平方永远是零)
小节:这些概念构成了微分几何的基础语言。如果你第一次接触这些概念,可能会觉得有些抽象。这是完全正常的!建议你:
- 先理解直观含义(用生活例子类比)
- 再看数学定义(严格化)
- 最后看具体例子(在具体流形上计算)
随着学习的深入,这些概念会变得越来越清晰。记住:数学概念的掌握是一个螺旋上升的过程——每次回顾都会有新的理解!
第二章:联络的直观起源——平行移动
2.1 欧氏空间的"免费午餐"
在欧氏空间 $\mathbb{R}^n$ 中,我们有一个"免费"的联络。给定一个向量场 $V(x) = (V^1(x), \ldots, V^n(x))$,我们想要计算它在某个方向 $W$ 上的变化率。在欧氏空间中,这很简单: $$ \nabla_W V(p) = \lim_{t \to 0} \frac{V(p + tW) - V(p)}{t} = \sum_{i,j=1}^n W^i(p) \left.\frac{\partial V^j}{\partial x^i}\right|_p \left.\frac{\partial}{\partial x^j}\right|_p $$
这个导数有一个关键性质:它在坐标变换下表现良好,因为 $\mathbb{R}^n$ 有一个自然的坐标系。
但在流形上,情况完全不同。如果我们使用坐标 $(x^1, \ldots, x^n)$ 计算偏导数 $\frac{\partial V^j}{\partial x^i}$,然后换到另一组坐标 $(\tilde{x}^1, \ldots, \tilde{x}^n)$,结果不会是我们期望的协变形式。
2.2 平行移动的几何直观
让我们从几何角度思考这个问题。假设我们有一条曲线 $\gamma: [a, b] \to M$,在起点 $\gamma(a)$ 有一个切向量 $v_0 \in T_{\gamma(a)} M$。我们想把这个向量沿曲线"平行移动"到终点 $\gamma(b)$。
在欧氏空间中,平行移动很简单:保持向量的分量不变即可。但在流形上,我们需要明确"平行"的含义。
球面的例子:考虑单位球面 $S^2$,从赤道上的点 $(1, 0, 0)$ 出发,向量 $v_0$ 指向正北方(即 $(0, 0, 1)$ 方向)。沿赤道平行移动这个向量到 $(0, 1, 0)$ 点。直觉上,我们希望向量始终保持"切于球面"且"不旋转"。
但什么是"不旋转"?在球面上,如果我们保持向量与路径垂直(这是对"平行"的一种合理理解),那么在 $(0, 1, 0)$ 点,向量将指向正西方 $(-1, 0, 0)$!继续沿赤道移动回到起点,向量将指向正南方 $(0, 0, -1)$——正好和初始向量相反!
这个例子告诉我们:平行移动的结果可能依赖于路径。这就是曲率的直观起源。
2.3 Levi-Civita的洞察
1917年,Levi-Civita在他的著作《绝对微分学的严格含义》中给出了平行移动的严格定义。他的关键洞察是:
在黎曼流形上,平行移动应该满足两个条件:
- 保持向量的长度不变
- 保持向量之间的夹角不变
这个定义后来被称为Levi-Civita联络,它是黎曼几何中最自然的联络。
形式化地说,设 $\gamma(t)$ 是一条曲线,$V(t)$ 是沿 $\gamma$ 的向量场。如果 $V(t)$ 沿 $\gamma$ 平行移动,那么: $$ \frac{D V(t)}{dt} = 0 $$ 其中 $\frac{D}{dt}$ 是我们即将定义的协变导数。
第三章:联络的严格定义——多种等价视角
联络的美妙之处在于它有多个等价的定义,每个定义都捕捉了概念的不同侧面。我们将逐一介绍这些定义,并展示它们之间的等价性。
3.1 第一定义:协变导数
定义(协变导数):联络 $\nabla$ 是一个映射,它将两个向量场 $X, Y \in \mathfrak{X}(M)$ 映射到一个新的向量场 $\nabla_X Y \in \mathfrak{X}(M)$,满足以下性质:
$\mathbb{R}$-线性(在 $Y$ 上): $$ \nabla_X (Y + Z) = \nabla_X Y + \nabla_X Z, \quad \nabla_X (fY) = f \nabla_X Y $$
莱布尼茨法则(在 $Y$ 上): $$ \nabla_X (fY) = X[f] \cdot Y + f \nabla_X Y $$
$\mathbb{R}$-线性(在 $X$ 上): $$ \nabla_{fX + gY} Z = f \nabla_X Z + g \nabla_Y Z $$
这里的 $\nabla_X Y$ 读作"$Y$ 沿 $X$ 方向的协变导数"。

图4:协变导数的几何意义。红色曲线是路径 $\gamma(t)$,绿色箭头表示向量场 $V$ 沿路径的变化。协变导数测量的是"切于流形"的那部分变化率。
协变导数的直观理解——为什么需要"协变"?
问题:为什么不能直接用普通的导数?什么是"协变"(covariant)?
让我们从一个具体的例子开始。
例子:平面向量场的导数
假设在 $\mathbb{R}^2$ 上有一个向量场 $V(x, y) = (V^1(x, y), V^2(x, y))$,比如: $$ V(x, y) = (x, y) $$ 这是一个简单的向量场:每一点 $(x, y)$ 的向量就是从原点到该点的箭头。
如果我们想计算这个向量场在 $x$ 方向的变化率,在微积分中我们学过: $$ \frac{\partial V}{\partial x} = \left(\frac{\partial V^1}{\partial x}, \frac{\partial V^2}{\partial x}\right) = (1, 0) $$ 这很直观:在 $x$ 方向每移动一个单位,向量的 $x$ 分量增加1。
但是! 这个简单的做法在流形上会出问题。
问题出在哪里?
当我们说"比较 $p$ 点的向量 $V(p)$ 和 $q$ 点的向量 $V(q)$“时,我们在做一个隐含的假设:这两个向量在同一个向量空间里。
在 $\mathbb{R}^n$ 中,这是对的——所有点的切空间都可以自然地等同到 $\mathbb{R}^n$ 本身。我们说"向量 $(1, 2)$“不需要指定它在哪一点。
但在流形上,$T_p M$ 和 $T_q M$ 是不同的向量空间!我们不能直接相减两个不同空间的元素。
类比:这就像试图比较"在北京买一公斤苹果的价格"和"在上海买一公斤苹果的价格”——这两个价格用不同的货币单位(虽然都是人民币,但苹果的质量标准可能不同)。在比较之前,我们需要一种"兑换"方式。
协变导数的解决方案
协变导数的核心思想是:在计算导数时,先"平行移动"后一个点的向量到前一个点,然后再比较。
具体地说,计算 $\nabla_X Y$ 的步骤是:
- 在 $p$ 点取向量场 $Y$ 的值 $Y(p) \in T_p M$
- 沿 $X$ 方向移动一小步到 $p + \varepsilon X$ 点(设为 $q$)
- 取 $Y(q) \in T_q M$
- 用平行移动把 $Y(q)$ “搬运"回 $T_p M$,记作 $P_{\varepsilon X}(Y(q))$
- 计算差商:$\frac{P_{\varepsilon X}(Y(q)) - Y(p)}{\varepsilon}$
- 取极限 $\varepsilon \to 0$
$$ \nabla_X Y(p) = \lim_{\varepsilon \to 0} \frac{P_{\varepsilon X}(Y(p + \varepsilon X)) - Y(p)}{\varepsilon} $$
这就是"协变"的含义:导数的结果在坐标变换下按照正确的规则变换(协变地变换),所以它是一个真正的张量。
一个具体的计算例子
让我们在极坐标下计算一个向量场的协变导数。
极坐标 $(r, \theta)$ 与直角坐标 $(x, y)$ 的关系: $$ x = r \cos\theta, \quad y = r \sin\theta $$
考虑径向向量场 $V = \frac{\partial}{\partial r}$。这是一个很自然的向量场:每一点都指向远离原点的方向。
如果我们计算 $\nabla_{\frac{\partial}{\partial r}} \frac{\partial}{\partial r}$,直觉上,沿着径向移动,$\frac{\partial}{\partial r}$ 的方向"不变”(始终沿着径向),所以应该等于零。计算也验证了这一点: $$ \nabla_{\frac{\partial}{\partial r}} \frac{\partial}{\partial r} = \Gamma_{rr}^k \frac{\partial}{\partial x^k} = 0 $$ 因为 $\Gamma_{rr}^k = 0$。
但如果我们计算 $\nabla_{\frac{\partial}{\partial \theta}} \frac{\partial}{\partial \theta}$,情况就不同了!
沿 $\theta$ 方向(圆周方向)移动时,$\frac{\partial}{\partial \theta}$ 的方向在旋转。计算结果是: $$ \nabla_{\frac{\partial}{\partial \theta}} \frac{\partial}{\partial \theta} = -r \frac{\partial}{\partial r} $$
这个 $-r$ 项告诉我们:沿圆周移动时,$\frac{\partial}{\partial \theta}$ 向径向"倒下”,速率与距离 $r$ 成正比。
物理直观:想象你在旋转木马上。当你沿圆周移动时,你感觉到的"离心力"就是这个协变导数的体现!
协变导数的性质解释
让我们回到协变导数的三个性质,看看它们为什么合理。
1. $\mathbb{R}$-线性(在 $Y$ 上)
$$ \nabla_X (Y + Z) = \nabla_X Y + \nabla_X Z $$
这很自然:和的导数等于导数的和,这是导数的基本性质。
2. 莱布尼茨法则(在 $Y$ 上)
$$ \nabla_X (fY) = X[f] \cdot Y + f \nabla_X Y $$
这是乘积法则的推广!$fY$ 是"函数 $f$ 乘以向量场 $Y$",求导时:
- $X[f]$:函数 $f$ 沿 $X$ 的变化率
- 乘以 $Y$:因为 $f$ 在变化,所以 $fY$ 也会因为 $f$ 的变化而变化
- 加上 $f \nabla_X Y$:向量场 $Y$ 本身的变化率,乘以当前的函数值 $f$
这和微积分中的 $(uv)’ = u’v + uv’$ 完全一致!
3. $\mathbb{R}$-线性(在 $X$ 上)
$$ \nabla_{fX + gY} Z = f \nabla_X Z + g \nabla_Y Z $$
这说的是:方向导数在方向上是线性的。如果你沿 $2X$ 方向求导,结果是沿 $X$ 方向求导的2倍。这也符合直觉。
为什么协变导数不是张量?
这是一个重要的微妙点。
问题:$\nabla_X Y$ 在坐标变换下如何变化?
答案:$\nabla_X Y$ 在固定 $X$ 和 $Y$ 后是一个向量场,所以它在坐标变换下按照向量的规则变换。但是,如果我们固定 $\nabla$,只看它对坐标基的作用 $\Gamma_{ij}^k$,这不是张量!
原因:Christoffel符号的变换规则中有一个涉及二阶导数的项: $$ \tilde{\Gamma}_{ij}^k = \cdots + \frac{\partial \tilde{x}^k}{\partial x^a} \frac{\partial^2 x^a}{\partial \tilde{x}^i \partial \tilde{x}^j} $$
二阶导数项的存在说明 $\Gamma_{ij}^k$ 不是张量。如果一个量是张量,它的变换规则只涉及一阶导数(雅可比矩阵)。
直观理解:这反映了 $\Gamma_{ij}^k$ 依赖于坐标系的选择——它描述的是坐标基向量的变化,而不仅仅是内在的几何结构。
但是!由 $\Gamma_{ij}^k$ 构成的某些组合是张量,比如曲率张量 $R_{ijk}^\ell$。这说明虽然 Christoffel符号本身不是张量,但它编码的几何信息(曲率)是内在的。
3.2 第二定义:Christoffel符号
在局部坐标 $(x^1, \ldots, x^n)$ 下,我们可以用Christoffel符号来表示联络。设 ${\frac{\partial}{\partial x^1}, \ldots, \frac{\partial}{\partial x^n}}$ 是坐标基向量场,定义: $$ \nabla_{\frac{\partial}{\partial x^i}} \frac{\partial}{\partial x^j} = \sum_{k=1}^n \Gamma_{ij}^k \frac{\partial}{\partial x^k} $$
其中 $\Gamma_{ij}^k$ 称为Christoffel符号(或联络系数)。
关键性质:在坐标变换下,Christoffel符号的变换规则是: $$ \tilde{\Gamma}{ij}^k = \sum{a,b,c} \frac{\partial \tilde{x}^k}{\partial x^c} \frac{\partial x^a}{\partial \tilde{x}^i} \frac{\partial x^b}{\partial \tilde{x}^j} \Gamma_{ab}^c + \sum_{a=1}^n \frac{\partial \tilde{x}^k}{\partial x^a} \frac{\partial^2 x^a}{\partial \tilde{x}^i \partial \tilde{x}^j} $$
这个变换规则中的第二项(涉及二阶导数)是关键——它确保了尽管 $\Gamma_{ij}^k$ 不是张量,但整个协变导数的表达式是张量性的。

图5:Christoffel符号的几何意义。在极坐标等曲线坐标系中,基向量 $\frac{\partial}{\partial r}$ 和 $\frac{\partial}{\partial \theta}$ 在不同点有不同的方向。Christoffel符号编码了这些基向量的变化率。
协变导数的坐标表示:
给定向量场 $X = \sum_i X^i \frac{\partial}{\partial x^i}$ 和 $Y = \sum_j Y^j \frac{\partial}{\partial x^j}$: $$ \nabla_X Y = \sum_{i,j,k} X^i \left(\frac{\partial Y^k}{\partial x^i} + \sum_{j=1}^n \Gamma_{ij}^k Y^j\right) \frac{\partial}{\partial x^k} $$
定义协变导数算子: $$ Y^k_{;i} = \frac{\partial Y^k}{\partial x^i} + \sum_{j=1}^n \Gamma_{ij}^k Y^j $$
例子:极坐标下的联络
在 $\mathbb{R}^2$ 的极坐标 $(r, \theta)$ 下,标准度量是 $ds^2 = dr^2 + r^2 d\theta^2$。非零的Christoffel符号是: $$ \Gamma_{\theta\theta}^r = -r, \quad \Gamma_{r\theta}^\theta = \Gamma_{\theta r}^\theta = \frac{1}{r} $$
让我们验证 $\Gamma_{\theta\theta}^r = -r$。向量 $\frac{\partial}{\partial \theta}$ 在直角坐标中是 $(-r\sin\theta, r\cos\theta) = (-y, x)$。沿 $\theta$ 方向移动时,这个向量的变化率大约指向圆心,大小与 $r$ 成正比——所以 $\Gamma_{\theta\theta}^r = -r$!
3.3 第三定义:平行移动
定义(平行移动):给定曲线 $\gamma: [a, b] \to M$,向量场 $V(t)$ 沿 $\gamma$ 平行移动当且仅当: $$ \frac{D V(t)}{dt} = \nabla_{\dot{\gamma}(t)} V(t) = 0 $$
在局部坐标下,如果 $\gamma(t) = (x^1(t), \ldots, x^n(t))$ 且 $V(t) = \sum_k V^k(t) \frac{\partial}{\partial x^k}\big|{\gamma(t)}$,平行移动的条件是: $$ \frac{d V^k}{dt} + \sum{i,j=1}^n \Gamma_{ij}^k \frac{d x^i}{dt} V^j = 0, \quad k = 1, \ldots, n $$
这是一阶线性常微分方程组。给定初值 $V(a)$,存在唯一的解。
关键观察:平行移动定义了一个线性等距同构: $$ P_\gamma: T_{\gamma(a)} M \to T_{\gamma(b)} M $$
这个映射称为沿曲线 $\gamma$ 的平行移动映射或和乐(Holonomy)。
3.4 第四定义:联络形式(Cartan的视角)
Élie Cartan在20世纪初发展了联络的活动标架法,这在物理应用(如规范场论)中特别有用。
定义(联络形式):在标架丛 $F(M)$ 上,一个联络可以表示为一个取值在 $\mathfrak{gl}(n, \mathbb{R})$ 中的1-形式 $\omega$,满足:
- 右等变:对于 $g \in GL(n, \mathbb{R})$,有 $R_g^{\ast} \omega = g^{-1} \omega g$
- 性质:对于任何垂直向量 $V$,$\omega(V)$ 给出 $V$ 的"方向"
虽然这个定义比较抽象,但它在处理主丛和规范场论时非常强大。实际上,物理学家使用的规范势(如电磁场的矢量势 $A_\mu$)本质上就是联络形式!
3.5 第五定义:水平分布
这是联络最几何化的定义。在纤维丛 $E \to M$ 上:
定义(水平分布):一个联络是切空间 $TE$ 的一种分解: $$ TE = H \oplus V $$ 其中 $V = \ker(d\pi)$ 是垂直分布(切于纤维),$H$ 是水平分布,满足:
- 直和分解:$T_e E = H_e \oplus V_e$ 对每个 $e \in E$
- 光滑性:$H$ 是一个光滑的子丛
- 右不变性:$H_{e \cdot g} = (R_g)_* H_e$

图6:纤维丛结构。底空间 $M$ 是圆,每一点的纤维是一条垂直线。水平分布给出了在每个点"水平移动"的方向,这是联络的几何本质。
水平提升:给定曲线 $\gamma: [a, b] \to M$ 和起点 $e_0 \in \pi^{-1}(\gamma(a))$,存在唯一的水平曲线 $\tilde{\gamma}: [a, b] \to E$ 使得 $\pi \circ \tilde{\gamma} = \gamma$。这个 $\tilde{\gamma}$ 称为 $\gamma$ 的水平提升。
第四章:曲率——联络的"失败程度"
有了联络,我们可以定义曲率。曲率测量的是平行移动沿无穷小闭合路径后的"旋转"。
4.1 曲率张量的定义
定义(曲率张量):给定联络 $\nabla$,曲率张量 $R$ 定义为: $$ R(X, Y)Z = \nabla_X \nabla_Y Z - \nabla_Y \nabla_X Z - \nabla_{[X, Y]} Z $$
其中 $[X, Y] = XY - YX$ 是向量场的李括号。
为什么这样定义?
直觉上:
- $\nabla_X \nabla_Y Z$:先沿 $Y$ 方向导数,再沿 $X$ 方向导数
- $\nabla_Y \nabla_X Z$:先沿 $X$ 方向导数,再沿 $Y$ 方向导数
- $\nabla_{[X,Y]} Z$:修正项,因为坐标可能不交换
如果 $\nabla$ 是欧氏空间的普通导数,那么 $R = 0$(混合偏导数可交换)。在流形上,$R$ 测量的是"导数不交换的程度"。
在局部坐标下: $$ R_{ijk}^\ell = \frac{\partial \Gamma_{jk}^\ell}{\partial x^i} - \frac{\partial \Gamma_{ik}^\ell}{\partial x^j} + \sum_{m=1}^n \Gamma_{im}^\ell \Gamma_{jk}^m - \sum_{m=1}^n \Gamma_{jm}^\ell \Gamma_{ik}^m $$
4.2 曲率与平行移动的关系
曲率与平行移动有深刻的关系。考虑一个由向量 $X$ 和 $Y$ 张成的小"平行四边形"路径,边长为 $s$ 和 $t$。沿这个路径平行移动一个向量 $Z$,回到起点后的变化是: $$ P_{\square}(Z) = Z - st \cdot R(X, Y)Z + O(s^2 t, st^2) $$

图7:曲率作为平行移动的"失败程度"。绿色向量是初始向量,紫色向量是绕红色闭合路径平行移动后的向量。两者之间的夹角(角盈)就是曲率的几何体现。
球面的例子:
在单位球面 $S^2$ 上,考虑 $\frac{\partial}{\partial \theta}$ 和 $\frac{\partial}{\partial \phi}$ 构成的坐标切向量。计算可得: $$ R\left(\frac{\partial}{\partial \theta}, \frac{\partial}{\partial \phi}\right)\frac{\partial}{\partial \theta} = \sin\theta \cos\theta \frac{\partial}{\partial \phi} $$
在赤道($\theta = \pi/2$)处,这正好给出 $R = 1$(单位球面的高斯曲率是1)。
4.3 截面曲率、Ricci曲率、标量曲率
从曲率张量可以导出几种重要的曲率概念:
截面曲率 $K(X, Y)$(对于 $X, Y$ 线性无关): $$ K(X, Y) = \frac{\langle R(X, Y)Y, X \rangle}{\langle X, X \rangle \langle Y, Y \rangle - \langle X, Y \rangle^2} $$
这是最直观的曲率概念——它测量由 $X$ 和 $Y$ 张成的二维截面的弯曲程度。
Ricci曲率 $Ric(X, Y)$: $$ Ric(X, Y) = \text{tr}(Z \mapsto R(Z, X)Y) $$
在局部坐标下:$Ric_{ij} = \sum_{k=1}^n R_{kij}^k$
标量曲率 $S$: $$ S = \text{tr}(Ric) = \sum_{i,j=1}^n g^{ij} Ric_{ij} $$
曲率的直观理解——从三角形内角和说起
曲率是微分几何中最核心的概念之一。让我们从最直观的角度来理解它。
欧几里得几何中的三角形
在平面上,任何三角形的内角和都是 $180^\circ$(或 $\pi$ 弧度)。这是欧几里得几何的基本性质。
球面上的三角形
在球面上,情况完全不同!考虑一个"球面三角形":
- 顶点A:北极 $(0, 0, 1)$
- 顶点B:赤道上的 $(1, 0, 0)$
- 顶点C:赤道上的 $(0, 1, 0)$
这个三角形的边都是大圆弧(球面上的"直线")。它的三个角都是 $90^\circ$,所以内角和是 $270^\circ$!
角盈(Angle Excess)
定义球面三角形的角盈为: $$ E = (\text{内角和}) - \pi $$
对于上面的三角形,$E = 3 \times \frac{\pi}{2} - \pi = \frac{\pi}{2}$。
Gauss的惊人发现
Gauss 发现:角盈与三角形的面积成正比! $$ E = K \times \text{Area} $$ 其中 $K$ 是高斯曲率。对于单位球面,$K = 1$。
这告诉我们什么?
曲率测量的是"几何偏离欧氏几何的程度":
- $K > 0$:球面状,内角和 $> \pi$
- $K = 0$:平面,内角和 $= \pi$
- $K < 0$:马鞍面状,内角和 $< \pi$
曲率张量的几何意义
曲率张量 $R(X, Y)Z$ 看起来很复杂,但它有一个清晰的几何解释。
无穷小平行四边形
想象在流形上有一个小的"平行四边形"回路,由向量 $sX$ 和 $tY$ 张成: $$ p \xrightarrow{sX} p+sX \xrightarrow{tY} p+sX+tY \xrightarrow{-sX} p+tY \xrightarrow{-tY} p $$
沿这个回路平行移动一个向量 $Z$,回到起点后,向量会发生旋转: $$ P_{\square}(Z) = Z - st \cdot R(X, Y)Z + \text{高阶项} $$
直观理解:
- 在平面上($R = 0$),平行移动向量后方向不变
- 在曲面上($R \neq 0$),向量会发生旋转
- 旋转的大小与曲率成正比,与回路的面积成正比
类比:这就像在磁场中移动电子——电子的相位会发生变化,变化量与磁场强度和回路面积成正比(Aharonov-Bohm效应)。
截面曲率——最直观的曲率
截面曲率 $K(X, Y)$ 是最直观的曲率概念,因为:
- 它是一个数(不是张量)
- 它有明确的几何意义:由 $X$ 和 $Y$ 张成的二维截面(曲面)的高斯曲率
几何解释:考虑由向量 $X$ 和 $Y$ 张成的二维平面。这个平面"切"出流形的一个二维截面。截面曲率就是这个截面的高斯曲率。
例子:
- 单位球面:$K = 1$(所有截面)
- 欧氏空间:$K = 0$(所有截面)
- 双曲平面:$K = -1$(所有截面)
Ricci曲率——体积的收缩
Ricci曲率测量的是体积的收缩率。
直观解释:考虑一个小球(测地球)在流形上的演化。Ricci曲率告诉我们在各个方向上体积如何变化。
物理类比:想象一群粒子从一点出发,向各个方向扩散。在正曲率空间中,这些粒子扩散得比在平面上慢(因为空间"向内弯曲");在负曲率空间中,扩散得更快(空间"向外展开")。
在广义相对论中:Einstein场方程将Ricci曲率与物质的能量-动量张量联系起来: $$ Ric - \frac{1}{2}Rg = 8\pi T $$ 这说的是:物质告诉时空如何弯曲(Ricci曲率),弯曲的时空告诉物质如何运动。
标量曲率——平均弯曲程度
标量曲率 $S$ 是所有方向的截面曲率的"平均"(准确地说,是适当加权的平均)。
几何意义:标量曲率出现在比较二维流形与欧氏平面面积的公式中。对于一个小测地三角形: $$ \text{Area} \approx \frac{\text{角盈}}{S/2} $$
第五章:Levi-Civita联络——黎曼几何的"黄金"联络
在所有可能的联络中,Levi-Civita联络在黎曼几何中占据特殊地位。它是由黎曼度量唯一确定的联络,满足两个条件:
5.1 基本定理
Levi-Civita联络的存在唯一性定理:
给定黎曼度量 $g$,存在唯一的联络 $\nabla$ 满足:
- 无挠性:$\nabla_X Y - \nabla_Y X = [X, Y]$
- 度量相容性:$X\langle Y, Z \rangle = \langle \nabla_X Y, Z \rangle + \langle Y, \nabla_X Z \rangle$
5.2 Christoffel符号的计算公式
对于Levi-Civita联络,Christoffel符号可以由度量直接计算:
$$ \Gamma_{ij}^k = \frac{1}{2} \sum_{\ell=1}^n g^{k\ell} \left(\frac{\partial g_{j\ell}}{\partial x^i} + \frac{\partial g_{i\ell}}{\partial x^j} - \frac{\partial g_{ij}}{\partial x^\ell}\right) $$
其中 $g_{ij} = \langle \frac{\partial}{\partial x^i}, \frac{\partial}{\partial x^j} \rangle$ 是度量的分量,$g^{k\ell}$ 是逆矩阵的元素。
证明思路:利用度量相容性和无挠性条件,可以推导出: $$ \langle \nabla_i \partial_j, \partial_\ell \rangle + \langle \partial_j, \nabla_i \partial_\ell \rangle = \partial_i g_{j\ell} $$
通过适当的组合(循环置换 $i, j, \ell$),可以解出 $\nabla_i \partial_j$。
Levi-Civita联络的直观理解——“最自然"的联络
问题:给定一个黎曼度量,有多少种联络可以与之相容?
答案是:无穷多!但是,只有一个既无挠又度量相容的联络——这就是Levi-Civita联络。
为什么这两个条件是"自然"的?
1. 无挠性 $
abla_X Y - abla_Y X = [X, Y]$
这个条件说的是:协变导数对向量场的作用"尽可能可交换”。
在坐标基 $\frac{\partial}{\partial x^i}$ 中,无挠性意味着: $$ \nabla_{\frac{\partial}{\partial x^i}} \frac{\partial}{\partial x^j} = \nabla_{\frac{\partial}{\partial x^j}} \frac{\partial}{\partial x^i} $$ 即 $\Gamma_{ij}^k = \Gamma_{ji}^k$。
直观理解:如果你先沿 $x$ 方向移动,再沿 $y$ 方向移动;或者反过来,两者的"修正"应该相同(除了路径不交换带来的李括号项)。
2. 度量相容性 $Xlangle Y, Z
angle = langle abla_X Y, Z angle + langle Y, abla_X Z angle$
这个条件说的是:平行移动保持向量的长度和夹角不变。
证明:设 $Y(t)$ 沿曲线 $\gamma(t)$ 平行移动,即 $\nabla_{\dot{\gamma}} Y = 0$。那么: $$ \frac{d}{dt} \langle Y, Y \rangle = \langle \nabla_{\dot{\gamma}} Y, Y \rangle + \langle Y, \nabla_{\dot{\gamma}} Y \rangle = 0 $$ 所以 $|Y|^2$ 是常数!
直观理解:平行移动就像"刚性移动"——向量的长度和相互之间的角度都保持不变。
为什么Levi-Civita联络是"黄金"联络?
- 唯一性:给定度量,只有一个联络同时满足无挠和度量相容
- 自然性:它不依赖任何额外的结构选择
- 物理重要性:广义相对论使用的就是Levi-Civita联络
- 计算方便:Christoffel符号有显式的计算公式
第六章:重要定理与结构方程
6.1 Cartan结构方程
Élie Cartan给出了曲率的漂亮表达式。设 $\omega^j$ 是对偶标架(1-形式),$\omega_i^j$ 是联络1-形式: $$ \nabla e_j = \sum_i \omega_j^i \otimes e_i $$
第一结构方程(挠率): $$ \Omega^i = d\omega^i + \sum_{j < k} \omega_j^i \wedge \omega^k $$
第二结构方程(曲率): $$ \Omega_i^j = d\omega_i^j + \sum_{k=1}^n \omega_i^k \wedge \omega_k^j $$
其中 $\Omega_i^j$ 是曲率2-形式。
6.2 Bianchi恒等式
曲率张量满足重要的微分关系:
第一Bianchi恒等式(对于无挠联络): $$ R(X, Y)Z + R(Y, Z)X + R(Z, X)Y = 0 $$
第二Bianchi恒等式: $$ (\nabla_X R)(Y, Z) + (\nabla_Y R)(Z, X) + (\nabla_Z R)(X, Y) = 0 $$

图8:曲率定义的几何直观。三个顶点表示不同的二阶协变导数组合,中心是曲率项。这个三角形关系反映了Bianchi恒等式的代数结构。
6.3 Gauss-Bonnet定理
联络和曲率理论的顶峰之一是Gauss-Bonnet定理,它建立了局部几何(曲率)与全局拓扑(欧拉示性数)之间的桥梁。
Gauss-Bonnet定理(紧致定向黎曼曲面): $$ \int_M K , dA = 2\pi \chi(M) $$ 其中 $K$ 是高斯曲率,$\chi(M)$ 是欧拉示性数。
对于球面 $S^2$:$\chi(S^2) = 2$,所以 $\int_{S^2} K , dA = 4\pi$。如果 $K \equiv 1$(单位球面),则面积 $A = 4\pi$,验证了定理。
第七章:测地线——联络定义的"最直"路径
测地线是联络理论的一个重要应用。直观上,测地线是"最直"的路径。
7.1 测地线的定义
定义:曲线 $\gamma: I \to M$ 称为测地线,如果它的切向量场沿自身平行移动: $$ \nabla_{\dot{\gamma}} \dot{\gamma} = 0 $$
在局部坐标下,测地线方程是: $$ \frac{d^2 x^k}{dt^2} + \sum_{i,j=1}^n \Gamma_{ij}^k \frac{d x^i}{dt} \frac{d x^j}{dt} = 0 $$
这是一个二阶常微分方程组。给定初始位置 $\gamma(0) = p$ 和初始速度 $\dot{\gamma}(0) = v$,存在唯一的测地线。
7.2 指数映射
指数映射 $\exp_p: T_p M \to M$ 定义为: $$ \exp_p(v) = \gamma_v(1) $$ 其中 $\gamma_v$ 是满足 $\gamma_v(0) = p$、$\dot{\gamma}_v(0) = v$ 的测地线。

图9:指数映射的几何意义。从极点 $p$ 出发,沿不同方向的测地线(不同颜色的曲线)将切空间中的向量映射到流形上的点。
性质:
- $\exp_p$ 在 $0 \in T_p M$ 附近是微分同胚
- $\exp_p$ 提供了 $p$ 点附近的"法坐标"
7.3 测地线的变分刻画
测地线有另一种等价定义:它是能量泛函的临界点。
给定曲线 $\gamma: [a, b] \to M$,定义能量: $$ E(\gamma) = \frac{1}{2} \int_a^b \langle \dot{\gamma}(t), \dot{\gamma}(t) \rangle , dt $$
$\gamma$ 是测地线当且仅当它是 $E$ 的临界点(对任何变分 $\gamma_s$,$\frac{d}{ds}E(\gamma_s)\big|_{s=0} = 0$)。
这对应物理学中的最小作用量原理——粒子沿测地线运动!

图10:测地线与非测地线的对比。绿色曲线是测地线(大圆弧),红色虚线是弯曲的非测地线路径。测地线是能量最小的路径。
测地线的直观理解——直线在流形上的推广
问题:在弯曲的空间中,什么是"直线"?
在平面上,直线是最简单的曲线——它不转弯。但在流形上,“不转弯"是什么意思?
测地线的定义:切向量沿自身平行移动
$$ \nabla_{\dot{\gamma}} \dot{\gamma} = 0 $$
这个定义说的是:沿曲线移动时,切向量的方向(相对于流形)不发生变化。
类比:
- 平面上的直线:切向量恒定,$\frac{d\dot{\gamma}}{dt} = 0$
- 流形上的测地线:切向量"沿曲线平行”,$\nabla_{\dot{\gamma}} \dot{\gamma} = 0$
例子:
- 球面上的测地线:大圆弧(如赤道、经线)
- 圆柱面上的测地线:螺旋线、直线(展开圆柱后)
- 平面上的测地线:直线
测地线方程的物理意义
测地线方程 $$ \frac{d^2 x^k}{dt^2} + \sum_{i,j=1}^n \Gamma_{ij}^k \frac{d x^i}{dt} \frac{d x^j}{dt} = 0 $$
可以理解为牛顿第二定律 $F = ma$ 在弯曲空间中的推广。
解释:
- $\frac{d^2 x^k}{dt^2}$:普通的加速度项
- $\sum_{i,j} \Gamma_{ij}^k \frac{d x^i}{dt} \frac{d x^j}{dt}$:“惯性力"或"引力"项
在广义相对论中,自由粒子(不受任何力)沿测地线运动。引力不是一种"力”,而是时空的弯曲——粒子只是在沿着"最直"的路径运动!
指数映射——从切空间到流形
指数映射 $\exp_p: T_p M \to M$ 是一个非常有用的工具。
直观理解:
- 在 $p$ 点的切空间 $T_p M$ 中取一个向量 $v$
- 从 $p$ 出发,沿 $v$ 的方向"走"长度 $|v|$
- 到达的流形上的点就是 $\exp_p(v)$
类比:在平面上,$\exp_p(v) = p + v$。在流形上,我们要"沿测地线走"。
为什么叫"指数映射"?
这个名称来自矩阵指数。对于矩阵 $A$,指数映射是 $\exp(A) = I + A + \frac{A^2}{2!} + \cdots$。在李群理论中,这个指数映射正是从李代数(切空间)到李群的映射。
测地线的变分原理——最小作用量
能量泛函: $$ E(\gamma) = \frac{1}{2} \int_a^b |\dot{\gamma}(t)|^2 , dt $$
变分原理:测地线是能量泛函的临界点。
物理解释:
- $E(\gamma)$ 是沿曲线 $\gamma$ 运动的"能量"
- 测地线是能量最小的路径(至少局部上)
- 这对应经典力学中的最小作用量原理
Lagrange力学类比: $$ L = \frac{1}{2} \sum_{i,j} g_{ij} \dot{x}^i \dot{x}^j $$
Euler-Lagrange方程正是测地线方程!这说明测地线问题可以看作一个力学系统。
测地线的应用
1. 广义相对论
- 粒子在引力场中沿测地线运动
- 光线也沿测地线传播(但这是类光测地线)
2. 计算机图形学
- 在曲面上插值点
- 计算曲面上的最短路径
3. 优化算法
- 自然梯度法:在参数流形上沿测地线搜索
- 流形上的优化问题
4. 神经科学
- 神经流形假设:神经活动可能位于某个低维流形上
- 测地线距离可以更好地表示神经活动的相似性
第八章:扭率——另一个重要的联络不变量
除了曲率,联络还有另一个重要的不变量:扭率。
8.1 扭率的定义
定义:联络 $\nabla$ 的扭率张量 $T$ 定义为: $$ T(X, Y) = \nabla_X Y - \nabla_Y X - [X, Y] $$
无挠联络:如果 $T \equiv 0$,则称 $\nabla$ 是无挠的或对称的。
在局部坐标下: $$ T_{ij}^k = \Gamma_{ij}^k - \Gamma_{ji}^k $$
所以无挠性等价于 $\Gamma_{ij}^k = \Gamma_{ji}^k$。
8.2 扭率的几何意义
扭率测量的是"闭合回路不闭合"的程度。具体地说,考虑由向量 $X$ 和 $Y$ 张成的小平行四边形路径。沿这个路径的"缺口"与扭率有关。
与曲率不同,扭率不是由度量确定的——它是联络的独立性质。在黎曼几何中,我们通常选择Levi-Civita联络,它是无挠的。但在芬斯勒几何和带 torsion 的几何中,有挠联络很自然。

图11:扭率的几何意义。红色箭头是 $\frac{\partial}{\partial u}$,绿色箭头是 $\frac{\partial}{\partial v}$。扭率测量的是沿不同方向移动时坐标系的"非交换性"。
扭率的直观理解——“缺口"几何
扭率是一个比曲率更难直观理解的概念。让我们从几个角度来理解它。
曲率 vs 扭率
- 曲率:平行移动一个向量绕小回路后,向量发生旋转
- 扭率:沿小回路移动后,起点和终点不重合(有"缺口”)
类比:想象你在一张卷曲的纸上画一个小的正方形网格:
- 如果纸是弯曲的(球面),网格的角加起来不是360°——这是曲率
- 如果纸是"扭曲"的(像螺旋面),网格的边可能无法闭合——这是扭率
坐标系的解释
扭率告诉我们:坐标系的基向量是否"对齐"。
- 在无挠坐标系中,$\frac{\partial}{\partial x^i}$ 和 $\frac{\partial}{\partial x^j}$ 的李括号正好是 $\nabla_i \partial_j - \nabla_j \partial_i$
- 在有挠坐标系中,两者相差一个扭率项
为什么黎曼几何中选择无挠联络?
Levi-Civita联络是无挠的。这个选择有几个原因:
自然性:在坐标基 $\frac{\partial}{\partial x^i}$ 中,我们希望 $\nabla_{\frac{\partial}{\partial x^i}} \frac{\partial}{\partial x^j} = \nabla_{\frac{\partial}{\partial x^j}} \frac{\partial}{\partial x^i}$(至少在对称化意义上)
与度量的相容性:无挠性 + 度量相容性唯一确定了Levi-Civita联络
物理合理性:在广义相对论中,时空的Levi-Civita联络是无挠的(虽然有人研究有挠引力理论)
有挠几何的应用
尽管黎曼几何使用无挠联络,有挠联络在其他领域很重要:
- 芬斯勒几何:度量不是二次型的几何,自然的有挠联络
- 带 torsion 的引力理论:Einstein-Cartan理论,考虑自旋-扭率耦合
- 全纯联络:复几何中,自然的有挠联络
- 晶格缺陷:连续介质力学中,扭率对应位错(dislocation)
第九章:应用与推广
联络的概念在数学和物理中有广泛的应用。
9.1 物理应用:规范场论
在物理学中,规范场本质上就是主丛上的联络!这是20世纪物理学和数学最深刻的联系之一。
电磁场作为 $U(1)$ 联络
电磁矢势 $A_\mu$ 在物理中是一个"势函数",它的规范变换是 $A_\mu \to A_\mu + \partial_\mu \lambda$。
在几何语言中:
- $U(1)$ 主丛上的联络1-形式 $\omega$ 对应矢势 $A$
- 曲率2-形式 $\Omega = d\omega$ 对应场强 $F = dA$
- $\Omega$ 在时空坐标下的分量是电磁场张量 $F_{\mu\nu} = \partial_\mu A_\nu - \partial_\nu A_\mu$
规范变换 = 联络的变换
物理中的规范变换正是联络在不同截面下的变换!这就是为什么矢势 $A_\mu$ 有"规范自由度"——它不是物理量,只有曲率 $F_{\mu\nu}$(电场和磁场)是物理可观测的。
杨-米尔斯理论
杨振宁和Mills在1954年将电磁理论推广到非阿贝尔群(如 $SU(2)$, $SU(3)$)。
杨-米尔斯场:
- 主丛:$SU(N)$ 丛(或 $SO(N)$ 丛等)
- 联络1-形式:$A = A_\mu^a T^a dx^\mu$,其中 $T^a$ 是李代数的生成元
- 曲率2-形式:$F = dA + A \wedge A$(注意有 $A \wedge A$ 项,这是非阿贝尔群的特征)
杨-米尔斯作用量: $$ S = -\frac{1}{4} \int \text{tr}(F_{\mu\nu} F^{\mu\nu}) \sqrt{-g} , d^4x $$
这正是曲率的"模长"!就像弯曲空间中测地线的偏离率由曲率决定,杨-米尔斯理论中规范场的演化由这个"曲率"决定。
标准模型:粒子物理的标准模型基于 $SU(3) \times SU(2) \times U(1)$ 规范群,对应的杨-米尔斯理论描述了:
- $SU(3)$:强相互作用(量子色动力学QCD)
- $SU(2) \times U(1)$:弱电相互作用
广义相对论中的联络
在爱因斯坦的广义相对论中,引力不是一种"力",而是时空的几何。
时空流形:四维洛伦兹流形 $(M, g)$,度量 $g$ 的符号差是 $(-, +, +, +)$。
Levi-Civita联络:$\Gamma_{\mu\nu}^\lambda$ 是时空上的"引力势"。注意这与Newton引力中的引力势 $\phi$ 类似——都是"势",但物理可观测的是"力"(场的导数)。
Einstein场方程: $$ R_{\mu\nu} - \frac{1}{2} R g_{\mu\nu} = 8\pi G , T_{\mu\nu} $$ 左边是几何量(由曲率导出),右边是物理量(能量-动量张量)。这个方程说的是:物质告诉时空如何弯曲,弯曲的时空告诉物质如何运动。
测地线运动:自由粒子(不受任何非引力作用)沿时空中的测地线运动: $$ \frac{d^2 x^\mu}{d\tau^2} + \Gamma_{\alpha\beta}^\mu \frac{d x^\alpha}{d\tau} \frac{d x^\beta}{d\tau} = 0 $$
这正是牛顿第二定律 $F = ma$ 在弯曲时空中的推广,其中"力"项由Christoffel符号表示。
9.2 几何应用:流形的分类
联络和曲率是流形分类的重要工具:
- 常曲率空间:$K \equiv \text{常数}$(球面、欧氏空间、双曲空间)
- 爱因斯坦流形:$Ric = \lambda g$
- 里奇流(Ricci Flow):$\frac{\partial g}{\partial t} = -2 Ric$,用于证明庞加莱猜想
里奇流与庞加莱猜想
里奇流是近年来几何学最激动人心的进展之一。它是由Hamilton在1980年代引入的,后来被Perelman用来证明庞加莱猜想。
里奇流方程: $$ \frac{\partial g_{ij}}{\partial t} = -2 Ric_{ij} $$
直观理解:度量随时间演化,使得曲率"扩散"。就像热传导使温度分布趋于均匀,里奇流使曲率分布趋于均匀。
类比:
- 热方程:$\frac{\partial T}{\partial t} = \alpha \nabla^2 T$
- 里奇流:$\frac{\partial g}{\partial t} = -2 Ric$
庞加莱猜想:任何单连通的闭合三维流形都同胚于三维球面。
Perelman的证明使用了里奇流,通过让度量演化,“抹平"曲率的不均匀性,最终证明流形必定是球面(或可以分解成球面的部分)。
9.3 信息几何——统计学的几何结构
信息几何是由Amari和 others 在1980年代发展起来的交叉领域,它将微分几何应用于统计学和信息论。
统计流形
核心思想:参数化的概率分布族可以看作一个黎曼流形。
例子:正态分布族 $N(\mu, \sigma^2)$ 可以用参数 $(\mu, \sigma)$ 表示。所有这样的分布构成一个二维流形(上半平面,因为 $\sigma > 0$)。
Fisher信息度量:在统计流形上,自然出现的度量是Fisher信息矩阵: $$ g_{ij}(\theta) = \mathbb{E}\left[\frac{\partial \log p(x|\theta)}{\partial \theta^i} \frac{\partial \log p(x|\theta)}{\partial \theta^j}\right] $$
这个度量测量的是参数空间中的"距离”——两个概率分布之间的"差异"。
$\alpha$-联络与对偶平坦性
在统计流形上,除了Levi-Civita联络,还有一族自然的联络:$\alpha$-联络。
定义: $$ \nabla^{(\alpha)}_X Y = \nabla_X Y + \frac{\alpha}{2} I(X, Y) $$
其中 $\nabla$ 是Levi-Civita联络,$I$ 是由概率分布的三阶矩定义的张量。
重要特例:
- $\alpha = 1$:e-联络(指数联络),用于指数族分布
- $\alpha = -1$:m-联络(混合联络),用于混合分布族
对偶平坦性:当流形对某个 $\alpha$-联络是平坦的(曲率为零),且对 $-\alpha$-联络也是平坦的,我们称它是对偶平坦的。这类流形有特别好的性质,被称为对偶平坦结构或Hessian结构。
应用
统计学:
- 参数估计的几何解释
- 渐近最优性的几何理解
信息论:
- KL散度的几何解释
- 信息投影(e-投影和m-投影)
机器学习:
- 自然梯度法:沿统计流形的测地线搜索,比普通梯度下降更快
- 神经网络的流形解释
优化:
- 镜像下降算法
- Bregman散度的几何解释
结语:联络的哲学意义
联络的概念是现代几何的基石。它解决了一个根本问题:如何在弯曲空间中做微积分?
从Levi-Civita的平行移动,到Cartan的活动标架,到现代物理的规范场论,联络的概念不断演化,但其核心思想始终如一:
联络是在不同点的切空间之间建立"比较"的方式。
这个看似简单的思想产生了深远的影响:
数学上:它使得我们能够在流形上定义导数、曲率、测地线等,从而将欧氏空间的微积分推广到弯曲空间。
物理上:它是规范场论的语言,描述自然界的基本相互作用。
哲学上:它告诉我们"比较"和"变化"需要额外的结构——不是自动给予的。
联络的美妙之处在于它的统一性:协变导数、平行移动、Christoffel符号、水平分布、联络形式——这些看似不同的概念实际上是同一个数学对象的不同面孔。这种统一性是现代数学的特征,也是数学之美的体现。
正如伟大的数学家陈省身所说:
“微分几何是研究微积分在弯曲空间中的表现形式。联络是连接不同点切空间的桥梁,没有这座桥梁,我们就无法在弯曲空间中定义导数,也就无法研究几何。”
希望这篇文章能够帮助你理解联络这个深刻而美妙的数学概念。如果你想要进一步探索,我推荐以下资源:
- do Carmo, M. Riemannian Geometry — 经典教材,清晰严谨
- Lee, J. Introduction to Riemannian Manifolds — 现代视角,适合自学
- Nakahara, M. Geometry, Topology and Physics — 物理应用导向
- 陈省身 微分几何讲义 — 大师之作,富有洞察力
数学的旅程永无止境,联络只是开始。祝你探索愉快!
第十章:主丛与结构群——联络的现代视角
在前面的章节中,我们主要在切丛的背景下讨论联络。但是,联络的真正威力在更一般的主丛理论中才完全显现。这一章将介绍主丛和结构群的概念,这是理解现代规范场论的数学基础。
10.1 主丛的定义
直观理解:主丛是一种特殊的纤维丛,其中纤维是一个群(结构群),而且这个群"自由地作用"在纤维上。
形式化定义:一个主丛 $P(M, G)$ 由以下数据构成:
- 总空间 $P$(一个光滑流形)
- 底空间 $M$(一个光滑流形)
- 结构群 $G$(一个李群)
- 投影 $\pi: P \to M$(光滑满射)
满足:
- $G$ 自由且右作用于 $P$:$(p, g) \mapsto p \cdot g$
- 轨道是纤维:$\pi^{-1}(x) = {p \cdot g : g \in G}$ 对于任何 $p \in \pi^{-1}(x)$
- 局部平凡性:对每个 $x \in M$,存在邻域 $U$ 和微分同胚 $\phi: \pi^{-1}(U) \to U \times G$,满足 $\phi(p \cdot g) = \phi(p) \cdot g$
例子:
1. 标架丛 $F(M)$
这是最重要的主丛例子。对于 $n$ 维流形 $M$,$F(M)$ 的元素是 $M$ 在某点的有序标架(基底)。
一个标架是 $n$ 个线性无关的切向量 $(e_1, \ldots, e_n)$,其中 $e_i \in T_p M$。
结构群 $G = GL(n, \mathbb{R})$ 通过右乘作用于标架: $$ (e_1, \ldots, e_n) \cdot A = (\sum_j A_j^1 e_j, \ldots, \sum_j A_j^n e_j) $$ 其中 $A = (A_j^i) \in GL(n, \mathbb{R})$。
2. Hopf丛 $S^3 o S^2$
这是一个经典的非平凡主丛:
- 总空间:$S^3 = {(z_1, z_2) \in \mathbb{C}^2 : |z_1|^2 + |z_2|^2 = 1}$
- 底空间:$S^2 = \mathbb{C}P^1$(复射影直线)
- 结构群:$U(1) = {e^{i\theta} : \theta \in \mathbb{R}}$
作用:$(z_1, z_2) \cdot e^{i\theta} = (e^{i\theta}z_1, e^{i\theta}z_2)$
这个丛是非平凡的——它不能全局地写成 $S^2 \times U(1)$。
10.2 主丛上的联络
定义(主丛联络):主丛 $P(M, G)$ 上的联络是切空间 $TP$ 的一种分解 $$ TP = H \oplus V $$ 其中 $V$ 是垂直分布(切于纤维),$H$ 是水平分布,满足:
- 右不变性:$H_{p \cdot g} = (R_g)_* H_p$
- 光滑性:$H$ 是光滑子丛
联络1-形式:
等价地,联络可以表示为一个 $\mathfrak{g}$-值1-形式 $\omega \in \Omega^1(P, \mathfrak{g})$,满足:
- 右等变:$R_g^{\ast} \omega = \text{Ad}_{g^{-1}} \circ \omega$
- 恢复性:对于垂直向量 $V \in V_p$,$\omega(V)$ 给出 $V$ 对应的李代数元素
曲率2-形式:
$$ \Omega = d\omega + \frac{1}{2} [\omega, \omega] $$
这是主丛上的曲率,它在物理中对应场强!
10.3 伴丛
给定主丛 $P(M, G)$ 和群 $G$ 在空间 $V$ 上的表示 $\rho: G \to \text{Aut}(V)$,我们可以构造伴丛 $E = P \times_\rho V$。
直观理解:如果主丛描述"对称性",伴丛描述"在对称性下变换的物理量"。
例子:
- 主丛:$U(1)$ 丛(电磁规范群)
- 伴丛:复线丛(电子的波函数在其上取值)
10.4 物理中的主丛
在规范场论中:
- 主丛:规范对称性(如 $U(1)$, $SU(2)$, $SU(3)$)
- 联络:规范势 $A_\mu$
- 曲率:场强 $F_{\mu\nu}$
- 伴丛:物质场(如电子场、夸克场)在其上取值
这就是为什么几何学对现代物理如此重要——规范场的语言本质上就是主丛上联络的语言!
第十一章:Jacobi场与测地偏离
如果你沿一条测地线运动,附近有一个粒子也在沿测地线运动,你们之间的距离如何变化?这个问题的答案由Jacobi场给出。
11.1 测地偏离方程
考虑一族测地线 $\gamma_s(t)$,其中:
- $t$ 是沿测地线的参数
- $s$ 参数化不同的测地线
定义变分向量场: $$ J(t) = \left.\frac{\partial \gamma_s(t)}{\partial s}\right|_{s=0} $$
$J(t)$ 描述了相邻测地线之间的"相对位置"。
Jacobi方程: $$ \frac{D^2 J}{dt^2} + R(J, \dot{\gamma})\dot{\gamma} = 0 $$
其中 $\frac{D}{dt}$ 是协变导数,$R$ 是曲率张量。
直观理解:
- $\frac{D^2 J}{dt^2}$:相邻测地线的相对加速度
- $R(J, \dot{\gamma})\dot{\gamma}$:曲率产生的"潮汐力"
11.2 共轭点
定义:点 $q = \gamma(t_1)$ 称为 $p = \gamma(0)$ 沿测地线 $\gamma$ 的共轭点,如果存在一个非零的Jacobi场 $J$ 沿 $\gamma$,满足 $J(0) = J(t_1) = 0$。
几何意义:共轭点是测地线不再是"最短"的地方。
类比:在球面上,从北极出发的任何经线(测地线)都会在南极相遇。南极是北极的共轭点——越过南极后,经线不再是测地线的最短部分。
11.3 Cartan-Hadamard定理
这是一个深刻的定理,它将曲率与流形的整体结构联系起来。
Cartan-Hadamard定理:设 $M$ 是完备、单连通的黎曼流形,且截面曲率处处 $K \leq 0$。那么对于任何 $p \in M$,指数映射 $\exp_p: T_p M \to M$ 是微分同胚。
推论:这样的流形微分同胚于 $\mathbb{R}^n$,而且任意两点之间有唯一的测地线。
直观理解:负曲率使得测地线"发散",不会相遇(除了起点)。这保证了指数映射是满射且单射的。
第十二章:具体计算例子
理论理解后,让我们通过一些具体的计算来巩固理解。
12.1 球面 $S^2$ 上的计算
度量:在球坐标 $(\theta, \phi)$ 中($\theta \in [0, \pi]$ 是极角,$\phi \in [0, 2\pi)$ 是方位角): $$ ds^2 = d\theta^2 + \sin^2\theta , d\phi^2 $$
所以 $g_{\theta\theta} = 1$, $g_{\phi\phi} = \sin^2\theta$, $g_{\theta\phi} = g_{\phi\theta} = 0$。
逆度量:$g^{\theta\theta} = 1$, $g^{\phi\phi} = \frac{1}{\sin^2\theta}$, $g^{\theta\phi} = g^{\phi\theta} = 0$。
Christoffel符号:
使用公式 $\Gamma_{ij}^k = \frac{1}{2} g^{k\ell}(\partial_i g_{j\ell} + \partial_j g_{i\ell} - \partial_\ell g_{ij})$:
$$ \Gamma_{\phi\phi}^\theta = -\sin\theta \cos\theta, \quad \Gamma_{\theta\phi}^\phi = \Gamma_{\phi\theta}^\phi = \cot\theta $$
其他 Christoffel 符号都为零。
测地线方程: $$ \begin{align} \frac{d^2\theta}{dt^2} - \sin\theta \cos\theta \left(\frac{d\phi}{dt}\right)^2 &= 0 \ \frac{d^2\phi}{dt^2} + 2\cot\theta \frac{d\theta}{dt} \frac{d\phi}{dt} &= 0 \end{align} $$
验证:经线 $\phi = \text{常数}$ 满足方程(因为 $\frac{d\phi}{dt} = 0$),所以经线是测地线——符合直觉!
曲率:计算高斯曲率 $K = 1$(单位球面)。
12.2 双曲平面 $\mathbb{H}^2$ 的计算
Poincaré上半平面模型: $$ \mathbb{H}^2 = {(x, y) \in \mathbb{R}^2 : y > 0}, \quad ds^2 = \frac{dx^2 + dy^2}{y^2} $$
度量:$g_{xx} = g_{yy} = \frac{1}{y^2}$, $g_{xy} = g_{yx} = 0$。
Christoffel符号: $$ \Gamma_{xx}^y = \frac{1}{y}, \quad \Gamma_{yy}^y = -\frac{1}{y}, \quad \Gamma_{xy}^x = \Gamma_{yx}^x = -\frac{1}{y} $$
测地线:可以验证,半圆 ${(x, y) : (x-a)^2 + y^2 = R^2, y > 0}$ 和垂直直线 ${(x_0, y) : y > 0}$ 都是测地线。
曲率:高斯曲率 $K = -1$(常数负曲率)。
12.3 极坐标下的 $\mathbb{R}^2$
度量:$ds^2 = dr^2 + r^2 d\theta^2$
Christoffel符号: $$ \Gamma_{\theta\theta}^r = -r, \quad \Gamma_{r\theta}^\theta = \Gamma_{\theta r}^\theta = \frac{1}{r} $$
测地线方程: $$ \begin{align} \frac{d^2 r}{dt^2} - r\left(\frac{d\theta}{dt}\right)^2 &= 0 \ \frac{d^2\theta}{dt^2} + \frac{2}{r}\frac{dr}{dt}\frac{d\theta}{dt} &= 0 \end{align} $$
直线 $y = ax + b$ 的极坐标表示:可以验证它满足这些方程!
第十三章:比较定理——用曲率控制几何
比较定理是一类强有力的定理,它允许我们通过比较一个流形的曲率与某个标准空间(如球面、欧氏空间、双曲空间)的曲率,来推断流形的几何性质。
13.1 Rauch比较定理
Rauch比较定理是所有比较定理的基础。它比较两个流形上的Jacobi场。
直观理解:如果一个流形的曲率比另一个"更正",那么它的Jacobi场增长得"更慢"——测地线发散得更慢。
13.2 Toponogov比较定理
Toponogov定理将曲率与三角形的性质联系起来。
陈述(简化版):如果流形 $M$ 的截面曲率处处 $K \geq K_0$,那么 $M$ 中的任何测地三角形的角不大于常曲率 $K_0$ 空间中对应三角形的角。
直观理解:正曲率使得三角形"膨胀"(角更大),负曲率使得三角形"收缩"(角更小)。
13.3 Bishop-Gromov体积比较定理
这个定理将Ricci曲率与体积增长联系起来。
陈述(简化版):如果流形 $M$ 的Ricci曲率满足 $Ric \geq (n-1)K$,那么测地球的体积不超过常曲率 $K$ 空间中测地球的体积。
直观理解:正曲率限制体积增长——空间"向内弯曲",使得球不能太"大"。
13.4 Bonnet-Myers定理
这是一个经典的紧性判据。
定理:如果流形 $M$ 的Ricci曲率满足 $Ric \geq (n-1)K > 0$,那么:
- $M$ 的直径 $\leq \frac{\pi}{\sqrt{K}}$
- $M$ 是紧致的
- $\pi_1(M)$ 是有限群
直观理解:正曲率使得空间"向内弯曲"到一定程度,必须自己"闭合"。
第十四章:历史注记——联络概念的发展
了解一个概念的历史发展有助于理解其本质。
14.1 前史时期(19世纪中叶)
Riemann (1854):在著名的就职演讲《论几何基础的假设》中,Riemann引入了黎曼度量的概念,但还没有严格的联络概念。他隐含地使用了"无穷小平行移动"的思想。
Christoffel (1869):引入了Christoffel符号,发展了"绝对微分学"(后来称为张量微积分)。这是联络的第一个具体表达式。
Ricci和Levi-Civita (1900):系统发展了张量微积分,为广义相对论奠定了数学基础。
14.2 平行移动的严格化(20世纪初)
Levi-Civita (1917):在他的著作《绝对微分学的严格含义》中,首次给出了平行移动的严格几何定义。这是联络概念的关键突破。
Weyl (1918):在他的书《空间、时间、物质》中,引入了"联络"这个术语(德语:连接),并发展了规范理论的思想。
14.3 Cartan的贡献(1920-1940年代)
Élie Cartan是联络理论的真正奠基人。他的贡献包括:
- 活动标架法:用移动的标架(坐标系)来描述几何
- 联络形式:将联络表示为取值在李代数中的微分形式
- 结构方程:著名的Cartan结构方程
- 纤维丛的雏形:虽然现代纤维丛理论后来才发展,但Cartan已经使用了这些思想
Cartan的《黎曼空间几何》和《李群理论与几何》是这个领域的经典之作。
14.4 现代发展(1950年代以后)
纤维丛理论:1950年代,数学家们(包括Ehresmann, Chern, Serre等)发展了现代纤维丛理论,将Cartan的思想形式化。
规范场论:1954年,杨振宁和Mills引入非阿贝尔规范场论。后来人们发现这本质上就是主丛上的联络!
Atiyah-Singer指标定理:1960年代,将拓扑、几何和分析联系起来,其中联络和曲率是关键工具。
14.5 陈省身与示性类
陈省身(Shiing-Shen Chern)在1940年代提出了陈示性类,这是用曲率表示的拓扑不变量。
陈类: $$ c_k = \frac{1}{k!} \left(\frac{i}{2\pi}\right)^k \text{tr}(\Omega^k) $$ 其中 $\Omega$ 是曲率2-形式。
陈类的美妙之处在于它将局部的几何量(曲率)与全局的拓扑性质联系起来——这是Gauss-Bonnet定理的高维推广!
第十五章:练习题与思考题
为了巩固理解,这里提供一些练习题和思考题。
15.1 基础练习
练习1:验证在极坐标 $(r, \theta)$ 下,$\mathbb{R}^2$ 的度量为 $ds^2 = dr^2 + r^2 d\theta^2$。计算所有Christoffel符号,并验证直线 $y = ax$ 满足测地线方程。
练习2:在二维流形上,证明高斯曲率可以用Christoffel符号表示为: $$ K = \frac{1}{\sqrt{\det g}} \left[ \frac{\partial}{\partial x}\left(\frac{\Gamma_{yy}^x}{\sqrt{\det g}}\right) - \frac{\partial}{\partial y}\left(\frac{\Gamma_{xy}^x}{\sqrt{\det g}}\right) \right] $$
练习3:验证对于单位球面 $S^2$,截面曲率 $K = 1$ 处处成立。
练习4:证明平行移动保持向量的长度(假设联络是度量相容的)。
练习5:计算圆柱面 $S^1 \times \mathbb{R}$ 的高斯曲率,并解释结果。
15.2 进阶练习
练习6:证明第一Bianchi恒等式: $$ R(X, Y)Z + R(Y, Z)X + R(Z, X)Y = 0 $$ (对于无挠联络)
练习7:证明Jacobi场沿测地线满足: $$ \frac{D}{dt} \langle J, \dot{\gamma} \rangle = \langle \frac{D J}{dt}, \dot{\gamma} \rangle $$
练习8:验证对于二维流形,Ricci曲率 $Ric = K g$,其中 $K$ 是高斯曲率。
练习9:证明在常曲率空间中,截面曲率确实是常数。
练习10:计算Poincaré圆盘 $\mathbb{D} = {z \in \mathbb{C} : |z| < 1}$ 配备度量 $ds^2 = \frac{4|dz|^2}{(1-|z|^2)^2}$ 的Christoffel符号和曲率。
15.3 思考题
思考1:为什么我们需要联络?能否定义一个"自然的"导数而不选择额外的结构?
思考2:曲率和扭率,哪个更"基本"?为什么在黎曼几何中我们通常选择无挠联络?
思考3:如果你生活在三维球面 $S^3$ 上,如何区分它和 $\mathbb{R}^3$?(提示:考虑平行移动和曲率)
思考4:在物理中,规范势 $A_\mu$ 有规范自由度。这在几何上对应什么?
思考5:为什么指数映射只在局部是微分同胚?什么情况下是全局的?
思考6:类比是理解数学的有力工具。你能想到联络在其他数学分支或物理中的类比吗?
思考7:考虑一个圆柱面和一个平面。它们有相同的局部几何(高斯曲率都为零),但整体不同。联络如何反映这种差异?
思考8:在信息几何中,$\alpha$-联络的物理或统计学意义是什么?
思考9:为什么纤维丛的局部平凡化条件是必要的?如果没有它会发生什么?
思考10:如果你要设计一个"有挠"的引力理论,物理上会发生什么变化?
结语:联络的统一之美
在这篇长文中,我们从一个简单的问题出发——“如何比较不同点的切向量?"——逐步构建了联络的整个理论体系。
回顾:我们学习了:
- 基本概念:流形、切丛、向量场、张量
- 联络的定义:协变导数、Christoffel符号、平行移动、联络形式、水平分布
- 曲率理论:曲率张量、截面曲率、Ricci曲率、标量曲率
- 重要应用:Levi-Civita联络、测地线、Jacobi场、比较定理
- 推广:主丛、规范场论、信息几何
核心洞见:
联络是一个"桥梁”——它连接了不同点的切空间,使我们能够在弯曲空间中做微积分。但它的意义远不止于此:
- 数学上:它统一了微分几何、拓扑、分析等多个领域
- 物理上:它是规范场论的语言,描述自然界的基本相互作用
- 哲学上:它揭示了"比较"和"变化"需要额外的结构
未完成的旅程:
联络理论远未完结。现代研究中仍有许多开放问题:
- 量子引力中的联络是什么?
- 如何将联络概念推广到非交换几何?
- 在高维几何和复几何中,联络有什么新的性质?
正如陈省身所说:“几何是数学的核心,而联络是几何的核心。”
希望这篇文章能够成为你探索微分几何世界的起点。数学的旅程永无止境,愿你在这条道路上发现更多美妙的风景!
参考文献与延伸阅读
- Levi-Civita, T. (1917). Nozione di parallelismo in una varietà qualunque. Rendiconti del Circolo Matematico di Palermo.
- Cartan, É. (1926). Les espaces à connexion affine. Annales Scientifiques de l’École Normale Supérieure.
- do Carmo, M. P. (1992). Riemannian Geometry. Birkhäuser.
- Lee, J. M. (2018). Introduction to Riemannian Manifolds (2nd ed.). Springer.
- Nakahara, M. (2003). Geometry, Topology and Physics (2nd ed.). Taylor & Francis.
