CICC科普栏目|自由能原理——统一的大脑理论发表时间:2024-06-28 15:03 导语 自由能原理被认为是“自达尔文自然选择理论后最包罗万象的思想”,从第一性原理出发解释智能体更新认知、探索和改变世界的机制,被认为有可能成为智能的第一性原理的重要候选方案,并有望成为新时代复杂系统的大统一理论。 这篇2010年发表于 Nature Reviews Neuroscience 的综述论文是自由能原理提出者 Karl Friston 撰写的经典综述,引用量达7745,且仍在逐年上升。该综述从自由能原理视角审视了生物和物理科学中一些重要的大脑理论,包括贝叶斯大脑、预测编码和信息最大化原则、层次推理和注意力理论、神经达尔文主义、信息论和最优控制理论等,表明几种全局性大脑理论可能在自由能框架内得到统一。 集智俱乐部「自由能原理与强化学习」读书会此前邀请到 Karl Friston 做关于自由能原理的报告,主题为“意识的物理学:主动推理的顶层逻辑”,从物理和神经生物学两条道路走向主动推理框架,探讨如何从第一性原理统一生命与意识。读书会回放视频现已上线,欢迎感兴趣的朋友观看。 图片 斑图地址:https://pattern.swarma.org/study_group_issue/667 研究领域:自由能原理,贝叶斯大脑,预测编码,神经达尔文主义,最优控制理论
摘要
1. 自由能原理
方框1:自由能原理
a部分表示定义自由能的各个量之间的依赖关系。这包括大脑的内部状态μ(t) ,及描述其与环境交换的量:感觉信号s(t) (及其运动),再加上动作 a(t) 。环境由运动方程描述,这些方程指定了环境隐藏状态的轨迹。感知输入的原因包括隐藏状态 x(t) 、参数θ以及控制随机涨落幅度 z(t) 和 w(t) 的精度 γ 。大脑的内部状态和动作使自由能 F( ̃s,μ) 最小化,自由能是感知输入和其原因的概率表示 q(θ|μ) 的函数。这种表示被称为识别密度(recognition density),由内部状态编码。自由能取决于两个概率密度:识别概率密度 q(θ|μ) 和生成感知输入及其原因的概率密度 p( ̃s,θ|m)。后者表示一个概率生成模型(用m表示),其形式由智能体或大脑决定。 b部分提供了自由能的另一种表达式,以显示其最小化过程包含的内容:动作只能通过提高准确性(即选择性地采样被预测的数据)来减少自由能。相反,优化大脑状态使得表征成为感知输入原因的近似条件密度。这使得动作能够避免惊奇的感知遭遇。下面提供了一个更形式化的描述。 优化充分统计量(表征) 优化识别密度使其成为感知数据原因的后验或条件密度:这可以通过将自由能表示为惊奇 –In p( ̃s,| m) 加上识别密度和条件密度(由图中的“内部状态”编码)之间的 Kullback-Leibler 散度来看出。因为这个散度总是正的,所以最小化自由能使得识别密度成为一个近似的后验概率。这意味着智能体以贝叶斯最优的方式隐式地推断或表征其感觉样本的诱因。同时,自由能成为惊奇的一个紧界,通过动作使其最小化。 优化动作 通过最小化自由能对环境采取行动,强制采样与当前表征一致的感知数据。这可以通过将自由能重新排列为准确性和复杂性的求和来看出。关键的是,动作只能影响准确性(由图中的“外部状态”编码)。这意味着大脑将重新配置其感觉上皮(epithelia),以采样识别密度预测的输入——换句话说,最小化预测误差。
2. 贝叶斯大脑假说 方框2:大脑中的分层信息传递
这幅图详细描述了一种神经元结构,它在感觉输入的分层模型中优化原因的条件期望。图中显示了前向驱动连接的潜在起源细胞(灰色箭头),这些连接从较低区域(例如外侧膝状核)传递预测误差到较高区域(例如V1),以及构建预测的非线性反向连接(黑色箭头)[41]。这些预测试图解释掉较低层次的预测误差。在这个方案中,前向和反向连接的来源分别是表浅和深层的金字塔形细胞(上三角和下三角),其中状态单元为黑色,错误单元为灰色。方程式代表使用下面的生成模型对自由能进行梯度下降的过程。上面的两个方程描述由错误单元编码的预测误差的形成,下面的两个方程表示识别动力学,使用自由能的梯度下降。
![]() 图 1:鸟鸣和感知分类。(a) 感知推理。用于模拟鸟类歌声的生成模型包含一个洛伦兹吸引子,它具有两个控制参数(或因果状态)(v(1), v(2))。这些参数进而提供给一个合成的咽鼓管(syrinx),产生调制幅度和频率的“鸣叫声”(以声谱图形式展示)。然后将这些“鸣叫声”作为刺激呈现给一个合成鸟,测试它是否能够推断出潜在的因果状态,并对歌声进行分类。这包括通过改变控制参数的内部表征(μ(v1), μ(v2))来最小化自由能。关于这个感知推理或分类的例子如下图所示。 (b) 感知分类。这里展示的是三种模拟歌声的声谱图。每种歌声包括一系列鸣叫声,其频率和数量从歌曲a到歌曲c逐渐减少,因为一个因果状态(被称为瑞利数,Raleigh number,a中的v1)减少了。 (c) 条件期望图和条件密度图。左图展示三首歌对应的因果状态的条件期望(μ(v1), μ(v2)),作为刺激后时间的函数。图中显示,因果状态在大约600毫秒后被准确地识别出来(90%的置信区间以灰色显示)。右图显示在刺激后时间即将结束前的条件密度(即左图中的虚线)。蓝点对应条件期望,灰色区域对应90%的条件置信区域。注意,这些包括用于生成歌声的真实值(红点)(v(1), v(2))。
3. 高效编码原则
4. 细胞集群和相关性理论
5. 有偏竞争和注意力
6. 神经达尔文主义与价值学习
7. 最优控制理论和博弈论 ![]() 图2. 提示性伸手动作示例。图的右下部分显示一个马达装置,包括具有两个隐藏状态的双关节臂,每个隐藏状态对应于两个关节的特定角度位置。食指的当前位置(红色圆圈)是描述每个关节位置的向量之和。这里世界的因果状态是目标的位置和亮度(绿色圆圈)。图的左侧部分说明大脑使用称为本体感觉输入(Sprop,信号传递关节的角度位置(x1,x2))的方式直接感知隐藏状态,并通过观察手指在空间中的位置(J1,J2)间接感知。此外,通过视觉输入(Svisual),智能体感知目标的位置(v1,v2)和亮度(v3)。感觉预测误差传递到大脑的更高层,以优化隐藏状态(即关节的角度位置)和因果状态(即目标)的条件期望。随后的预测被发送回来抑制感觉预测误差。与此同时,感觉预测误差还试图通过行动改变感觉输入来抑制自己。 ![]() 图3. 利用先验期望解决山地车问题。(a) 如何从关于世界隐藏状态运动的简单先验中产生矛盾但适应性的行为(例如,远离目标以确保稍后获得安全)?图中显示的是山地车的势能函数或景观(在位置 x=–0.5 处取最小值)。山地车位于山坡上的目标位置 x=1,由红色圆圈标示。关键是,在 x=0 处,智能体无法克服对车辆的力,因为作用力被施加了一个压缩函数 –1≤σ≤1,以防止其大于1。这意味着智能体只能通过从左侧山坡中间开始获得足够的动力来到达另一侧的目标位置。
8. 结论和未来方向 ![]() 图4. 自由能原理及其他理论。这篇综述中考虑了一些理论构建,并阐述了它们与自由能原理的关系。变量的描述在第方框1、2中,方程的详细解释可以在补充信息S1–S4(方框)中找到。
参考文献
学者简介 ![]() |