人工智能、机器学习与深度学习:层层嵌套的同心圆。
这三个术语在新闻标题里常被混用,但它们并不是一回事。本篇为你建立一个精确而持久的思维模型:人工智能是宏大的目标,机器学习是实现这一目标的一类方法,而深度学习是这类方法中的一种技术。读完之后,你将能够看懂任何关于"AI"的说法,并把它准确地放到这张地图上——这比任何营销文案都更能告诉你它能做什么、不能做什么。
最外层的圆:人工智能。
人工智能(AI)是这三个术语中最古老、最宽泛的一个。它指代的是一个目标,而非一种方法:让计算机去完成那些由人类来做时会被称为"智能"的任务——识别一张人脸、理解一句话、规划一条路线、下棋、诊断故障。这个领域在 1956 年得名,而在它历史的大部分时间里,主流方法与"从数据中学习"毫无关系。
早期 AI 主要是符号式的——有时被戏称为"老式 AI"。工程师编写明确的规则:IF 温度 > 100 AND 压力上升 THEN 触发警报。这类系统称为专家系统,靠人工把人类知识编码进去。它们在狭窄而透彻理解的领域中表现良好,可一旦现实做出规则编写者未曾预料的事情,就会严重失效。为"在照片里认出一只猫"编写规则被证明几乎是不可能的——没有人能列举出在任意光照下区分猫与小狗的所有规则。
需要记住的关键点:AI 是一把大伞。一台口袋计算器、1997 年的国际象棋引擎、一个垃圾邮件过滤器、一个现代聊天机器人,在宽泛意义上都是"AI"。单凭这个词,几乎说明不了一个系统是如何工作的。
中间一层的圆:机器学习。
机器学习(ML)是 AI 的一个子集,其定义在于系统如何获得它的能力。不是由人来编写规则,而是由系统从样例中推断出规则。你给它看成千上万张标注为"猫"或"非猫"的照片,一个优化过程不断调整系统内部的数字,直到它能很好地预测这些标签。从来没有人写下"猫有尖耳朵"——这个模式是从数据中学到的。
这是整个领域中关键的概念转变:用样例编程,而非用指令编程。这正是机器学习攻克了符号式 AI 无法解决的问题(感知、语言、推荐)的原因——对这些问题,我们虽然说不清规则,却能提供样例。
机器学习自身也有几种风格,值得记住它们的名字:
- 监督学习——从带标签的样例(输入 → 期望输出)中学习。垃圾邮件检测、图像分类、价格预测。
- 无监督学习——在无标签数据中发现结构:将相似客户分组、压缩数据、检测异常。
- 强化学习——通过试错并依据奖励信号来学习。游戏智能体和机器人控制;也是调校现代聊天机器人的关键要素之一。
一句有用的口号:机器学习系统是一个函数,其行为由数据加优化过程决定,而非由手写逻辑决定。
最内层的圆:深度学习。
深度学习是机器学习的一个子集,它使用具有许多层的人工神经网络("深"指的是层数,而非深奥)。神经网络是一种特定的、灵活的数学结构——大致受生物神经元启发——它通过许多连续的数值变换把输入转化为输出,而这些变换的参数是学出来的。
深度学习在原理上并不新——核心思想可追溯到 1980 年代——但它在 2012 年前后成为主流,当时三件事同时到位:极大规模的带标签数据集、足够快以训练大型网络的图形处理器(GPU),以及更精炼的训练技术。从那以后,几乎每一项登上头条的 AI 成果——图像识别超越人类、机器翻译、蛋白质结构预测,以及像生成这段文字这样的大语言模型——都属于深度学习。
定义深度学习的权衡是:它能直接从原始数据(像素、字符、音频采样)中学习极其复杂的模式,几乎不需要人工特征工程,但它需要大量数据和大量算力,且最终的模型难以解释——你得到一个能用的系统,却没有关于它为什么有效的整洁说明。
嵌套关系核对:每个深度学习系统都是机器学习系统,每个机器学习系统都是 AI 系统——但反过来不成立。手写的国际象棋引擎是 AI,但不是 ML。使用简单统计的垃圾邮件过滤器是 ML,但不是深度学习。大语言模型则三者皆是。
为什么这种区分在实践中重要。
这张地图不是学术上的冷知识;它能预测行为。当你知道一个系统是用样例训练出来的深度学习模型时,你立刻可以预见它的典型特性:它对与训练数据相似的输入泛化得令人印象深刻,对与训练内容毫不相像的输入则会不可预测地退化,它无法用人类的语言解释自己,而且除非专门训练过,它没有内建的"我不知道"概念。这些都不是可以打补丁消除的 bug——它们是"从数据学模式而非遵循书面规则"的直接后果。
反过来,基于规则的系统可预测、可审计,但很脆:它严格执行被告知的内容,包括在现实越出规则之外时自信地做错事。许多真实产品两者兼用——用一个学出来的模型做感知,外面包裹着手写的安全规则。
所以当你读到"我们的产品使用了 AI"时,要问的精确问题是:哪一个圈?手写规则、从数据学来的统计,还是一个深度神经网络?答案会告诉你它会如何失败、它被多少数据塑造,以及你能在多大程度上信任它解释自己——而这几乎就是你真正需要知道的全部。