张量与多维数据

张量:从数学抽象到深度学习核心的系统综述

引言:多维世界的数学语言 想象你正在观察一个正在旋转的陀螺。描述它需要多少参数? 位置:$3$ 个坐标 $(x, y, z)$ 方向:$3$ 个欧拉角 角速度:$3$ 个分量 转动惯量:$9$ 个数($3 \times 3$ 矩阵) 这些量不仅仅是数字的集合,它们有特定的变换规则。当坐标系旋转时,位置和角速度按向量规则变换,而转动惯量则按更复杂的规则变换——这就是张量。 在物理学中,张量是描述场的通用语言。爱因斯坦的广义相对论用张量写下: $$G_{\mu\nu} + \Lambda g_{\mu\nu} = \frac{8\pi G}{c^4} T_{\mu\nu}$$ 在深度学习中,一张 $224 \times 224$ 的彩色图像是 $224 \times 224 \times 3$ 的三阶张量。一批 $32$ 张这样的图像是 $32 \times 224 \times 224 \times 3$ 的四阶张量。 本文将带你走进张量的世界,从数学定义到物理直觉,从代数运算到现代应用,理解为什么张量成为描述复杂系统的核心工具。 第一章:张量的本质——超越矩阵的多维数组 1.1 从标量到张量 在数学中,我们熟悉不同维度的对象: 图 1:张量的维度层级。从0阶标量(单个数字)到1阶向量、2阶矩阵,再到3阶及更高阶张量,维度不断增加。 *0阶张量:标量 标量只有一个数值,没有方向: $$a = 5, \quad T = 300\text{K}, \quad E = mc^2$$ 标量在坐标变换下不变——无论你从哪个角度看,温度始终是 $300$K。 ...

January 29, 2026 · 5 min · 1019 words · s-ai-unix
谱定理可视化

谱定理:线性代数的优雅与机器学习的基石

引言:对称性的数学之美 在数学的众多分支中,有一个深刻的原理反复出现:对称性带来简化。在物理学中,空间的对称性意味着守恒量;在群论中,对称结构导致简单的表示;在线性代数中,对称矩阵拥有最优雅的对角化理论——这就是谱定理。 想象你站在一个椭圆中心。如果你沿任意方向看出去,椭圆的"宽度"各不相同。但有两个特殊的方向——椭圆的长轴和短轴——沿这些方向,椭圆的形状最简单,只是一个被拉伸的圆。这两个正交的方向,就是椭圆的"主轴",它们对应的拉伸倍数,就是"特征值"。 这个直观的几何图像,正是谱定理的核心。谱定理告诉我们:任何实对称矩阵都可以通过正交变换对角化。换句话说,在适当的坐标系下,对称矩阵描述的线性变换只是沿某些正交方向的简单拉伸。 在机器学习和深度学习中,谱定理无处不在。从主成分分析(PCA)到奇异值分解(SVD),从谱聚类到图神经网络,谱定理提供了理解数据和算法的理论基础。 在这篇文章中,我们将系统性地介绍谱定理的核心理论,从实对称矩阵的正交对角化到一般的奇异值分解,从PCA到谱聚类,深入浅出地推导每一个公式,并通过可视化图形直观理解这些概念。 第一章:谱定理的基础理论 1.1 特征值与特征向量:不变的方向 给定一个 $n \times n$ 矩阵 $A$,如果存在非零向量 $v \in \mathbb{R}^n$ 和标量 $\lambda \in \mathbb{R}$,使得 $$ Av = \lambda v $$ 则称 $\lambda$ 是 $A$ 的特征值,$v$ 是对应的特征向量。 几何意义:特征向量 $v$ 是线性变换 $A$ 下的"不变方向"——变换后,这个向量只是被拉伸或压缩了 $\lambda$ 倍,方向保持不变。 特征多项式:特征值是特征方程的根 $$ \det(A - \lambda I) = 0 $$ 对于 $n \times n$ 矩阵,这是一个 $n$ 次多项式,在复数域上有 $n$ 个根(计入重数)。 1.2 对称矩阵的特殊性质 实对称矩阵 $A \in \mathbb{R}^{n \times n}$(即 $A^\top = A$)拥有三个重要性质: ...

January 25, 2026 · 7 min · 1458 words · s-ai-unix