
张量:从数学抽象到深度学习核心的系统综述
引言:多维世界的数学语言 想象你正在观察一个正在旋转的陀螺。描述它需要多少参数? 位置:$3$ 个坐标 $(x, y, z)$ 方向:$3$ 个欧拉角 角速度:$3$ 个分量 转动惯量:$9$ 个数($3 \times 3$ 矩阵) 这些量不仅仅是数字的集合,它们有特定的变换规则。当坐标系旋转时,位置和角速度按向量规则变换,而转动惯量则按更复杂的规则变换——这就是张量。 在物理学中,张量是描述场的通用语言。爱因斯坦的广义相对论用张量写下: $$G_{\mu\nu} + \Lambda g_{\mu\nu} = \frac{8\pi G}{c^4} T_{\mu\nu}$$ 在深度学习中,一张 $224 \times 224$ 的彩色图像是 $224 \times 224 \times 3$ 的三阶张量。一批 $32$ 张这样的图像是 $32 \times 224 \times 224 \times 3$ 的四阶张量。 本文将带你走进张量的世界,从数学定义到物理直觉,从代数运算到现代应用,理解为什么张量成为描述复杂系统的核心工具。 第一章:张量的本质——超越矩阵的多维数组 1.1 从标量到张量 在数学中,我们熟悉不同维度的对象: 图 1:张量的维度层级。从0阶标量(单个数字)到1阶向量、2阶矩阵,再到3阶及更高阶张量,维度不断增加。 *0阶张量:标量 标量只有一个数值,没有方向: $$a = 5, \quad T = 300\text{K}, \quad E = mc^2$$ 标量在坐标变换下不变——无论你从哪个角度看,温度始终是 $300$K。 ...








