引言:AI的“常识”困境
当前以深度学习为主导的人工智能在特定任务上(如图像识别、下围棋)表现卓越,但它们往往缺乏人类最基本的“常识”。例如,一个顶尖的图像分类模型可以识别“咖啡杯”,但它可能无法理解“如果咖啡杯是满的,把它倒过来咖啡会洒出来”这一简单事实。
这种对世界的基本物理、社会和心理规则的隐性理解,被称为常识。为了让AI系统更通用、更可靠、更能与人类自然交互,研究者们开始回归一个更古老但历久弥新的理念:认知架构。
什么是认知架构?
认知架构可以理解为智能体的“操作系统”或“心智蓝图”。它是一个固定的、跨领域的底层计算结构,旨在产生通用智能行为。与为特定任务(如翻译)设计的模型不同,认知架构提供了一套统一的机制来处理感知、学习、记忆、推理、决策和行动。
图1: 经典认知架构Soar的标志,它是最早且持续发展的认知架构之一
其核心目标是解释和实现人类水平的智能,而不仅仅是模拟某个智能行为的外在表现。它更关注“如何思考”,而非“思考什么”。
核心组件与工作原理
一个典型的认知架构通常包含以下相互连接的模块:
- 感知模块:将原始传感器数据(如像素、声音波形)转化为有意义的符号化或亚符号化表征。
- 工作记忆:存储当前任务相关的临时信息,相当于意识的“黑板”。
- 长期记忆:通常进一步分为:
- 陈述性记忆:存储事实和知识(如“巴黎是法国的首都”)。
- 程序性记忆:存储技能和“如何做”的规则(如“如何系鞋带”)。
- 推理与决策引擎:根据当前目标、工作记忆内容和长期记忆中的知识,选择并执行最合适的动作或认知操作。
- 学习机制:通过经验更新长期记忆中的知识和规则。
这些组件在一个持续的“感知-认知-行动”循环中协同工作。决策引擎常常基于“如果-那么”的产生式规则系统或更复杂的效用计算来运作。
# 一个高度简化的认知架构决策循环伪代码示例
while goal_not_achieved:
# 1. 感知
current_state = perceive(environment)
working_memory.update(current_state)
# 2. 模式匹配:从长期记忆中检索相关的规则/知识
applicable_rules = match(working_memory, long_term_memory.rules)
# 3. 冲突消解:选择一条最合适的规则执行
selected_rule = resolve_conflict(applicable_rules)
# 4. 执行动作(外部行动或内部认知操作)
execute(selected_rule.action)
# 5. 学习:根据结果可能创建或调整规则
learn_from_outcome(selected_rule, outcome)
经典认知架构实例
1. SOAR
由约翰·莱尔德等人开发,是历史最悠久的认知架构之一。其核心是基于规则的产生式系统和子目标化问题解决。SOAR将所有认知活动视为在问题空间中搜索目标,当遇到障碍(死胡同)时,会自动创建子目标来学习新知识。
2. ACT-R
由约翰·安德森提出,是一个更紧密地基于人类认知心理学实验数据的架构。它将知识分为陈述性和程序性两种记忆,并引入了“激活扩散”机制来模拟人类记忆的检索速度和准确性。
这个公式描述了ACT-R中一个记忆块(chunk)的激活值计算,它决定了该记忆被检索到的可能性。其中包含基础激活、关联激活和随机噪声。
3. Sigma (Σ)
一个更现代的架构,试图将传统的符号推理与概率计算(如贝叶斯推理)以及深度学习等亚符号处理统一在一个基于图的通用架构中,代表了认知架构与当代AI融合的趋势。
与深度学习的对比与融合
认知架构与主流深度学习范式存在根本性差异:
- 目标不同:DL追求特定任务的性能最优化;认知架构追求通用智能的机制解释和实现。
- 知识表征:DL知识分布在神经网络的权重中,是隐式、难以解释的;认知架构的知识通常是显式的符号或规则。
- 学习方式:DL依赖大规模数据和端到端训练;认知架构更强调从小样本中快速学习、推理和知识组合。
- 可解释性:认知架构的决策过程通常可追溯(基于哪些规则),而DL常被视为“黑箱”。
然而,两者并非对立,而是互补。当前的前沿趋势是神经符号AI,即让深度学习负责感知和模式识别(“直觉”),而认知架构或符号系统负责高层推理和规划(“逻辑”)。例如,用CNN识别物体,再用基于认知架构的推理系统判断这些物体之间的关系并规划行动。
通往AGI的路径
许多研究者认为,纯粹基于数据驱动的深度学习难以自发产生常识和深层次推理能力。认知架构提供了一条不同的AGI路径:
- 内置的通用结构:提供一个预先设计好的、支持多种认知功能的统一框架,智能体在此框架内通过学习和经验填充具体知识。
- 常识的基石:通过在架构中设计对时间、空间、因果关系、自我和他人心智的基本表示和处理机制,为常识推理打下基础。
- 累积学习:新学到的知识可以结构化地整合到现有知识体系中,实现终身学习和知识复用,而不是像许多DL模型那样“学了新的忘了旧的”。
图2: 神经符号AI整合示意图,展示了感知(神经网络)与推理(符号系统)的协同
挑战与未来展望
认知架构的发展面临显著挑战:
- 规模问题:如何将海量的世界知识高效地编码和存储在符号系统中?
- 感知-认知鸿沟:如何将连续的、高维的感知数据(如图像)无缝转化为离散的符号进行推理,再将推理结果反馈给行动?
- 灵活性与刚性:预先定义好的架构如何保证足够的灵活性以应对开放世界中无穷无尽的新情况?
- 开发复杂度:构建一个完整的认知架构是极其复杂的系统工程。
未来,认知架构的研究将与深度学习、强化学习、概率编程等领域更深度地融合。其价值不仅在于最终实现AGI,更在于为构建可解释、可信赖、具备基本常识的AI系统提供了关键的设计哲学和工程蓝图。它提醒我们,智能不仅仅是模式匹配,更是基于知识的理性思考。
结论
认知架构是AI领域中一个追求“本质智能”的深邃分支。它不满足于让机器在狭窄任务上表现优异,而是试图为机器构建一个能够理解、推理和学习世界的通用心智基础。
虽然它不像大语言模型那样引人瞩目,但其对常识、推理和可解释性的关注,正是当前AI迈向下一阶段所急需的。在神经符号融合的浪潮下,认知架构的理念和组件很可能成为未来AI系统中不可或缺的“理性引擎”,与强大的“感知直觉”(深度学习)相结合,共同缔造更接近人类智慧的机器。
对于AI学习者而言,了解认知架构有助于跳出“调参炼丹”的单一视角,从第一性原理思考智能的本质,这或许是探索通用人工智能道路上最宝贵的思维工具之一。