LLM发展关键术语：从"单词卡片"到"思维网络"

2024-11-18

一、基础构建模块

1. 标量（Scalar）

形象比喻：一个单独的数字，比如你的体重 65 kg，或者温度 23°C。
数学概念？ ✅ 是。标量是只有大小、没有方向的量。
LLM/编程中？ ✅ 也常用。例如神经网络中的某个权重值就是一个标量。

2. 向量（Vector）

形象比喻：一列有序的数字，比如你每天走的步数 [8000, 9500, 7200]，或者空间中的箭头（有方向和长度）。
数学概念？ ✅ 是。向量既有大小又有方向，通常表示为一维数组。
LLM/编程中？ ✅ 非常常见。词嵌入（word embedding）就是把一个词变成一个向量，比如 “猫” → [0.2, -1.3, 0.8, …]。

3. 矩阵（Matrix）

形象比喻：一张表格，比如学生成绩表：
数学英语物理
90 85 88
78 92 80
数学概念？ ✅ 是。矩阵是二维的数字排列，用于线性代数运算。
LLM/编程中？ ✅ 常见。比如注意力机制中的 Q、K、V 矩阵，或者图像数据（灰度图就是一个矩阵）。

4. 张量（Tensor）

形象比喻：
- 标量是 0 维张量（一个点），
- 向量是 1 维张量（一条线），
- 矩阵是 2 维张量（一张纸），
- 3 维张量就像一本书（多页矩阵叠起来），
- 更高维张量就像多个这样的“书堆”再堆叠起来。
数学概念？ ✅ 是（但更广义）。在数学/物理中，张量是一种满足特定变换规则的多维对象（比如应力张量、电磁场张量）。
LLM/编程中？ ✅✅ 非常核心！在深度学习框架（如 PyTorch、TensorFlow）中，“张量”泛指任意维度的数组。所以这里的“张量”其实是多维数组的同义词，比数学中的定义更宽泛、更工程化。

5. 数组（Array）

形象比喻：编程里的“容器”，可以装数字、字符等。比如 [1, 2, 3] 或 [[1,2],[3,4]]。
数学概念？ ❌ 不完全是。传统数学中不常用“数组”这个词，更多用“向量”“矩阵”等。
LLM/编程中？ ✅✅ 是基础数据结构。NumPy 数组、Python 列表本质上都是数组。在 LLM 中，输入文本被转换成“整数数组”（token IDs），再变成“嵌入向量数组”。

总结对比表

名称	数学概念？	LLM / 编程术语？	维度特点	举例
标量	✅	✅	0 维	3.14, -5
向量	✅	✅	1 维	[1, 2, 3]
矩阵	✅	✅	2 维	[[1,2],[3,4]]
张量	✅（广义）	✅✅（核心术语）	任意维度（0~N 维）	图像（3D）、批次数据（4D）
数组	❌（非正式）	✅✅（基础结构）	任意维度（编程实现）	NumPy array, list

Author yesplease

LastMod 2024-11-18

License CC BY-NC-ND 4.0