神经现象学的数学视角:自由能原理和主动推理如何描述现象意识
创始人
2025-05-02 08:21:20

在意识科学研究中,基于第三人称认知表征的计算功能主义,与重视主观体验、基于结构真实的整合信息论(IIT)纷争背后,是意识科学正在经历的「结构性转向」。在这种方法中,主观现象空间的数学结构可以作为描述意识体验的新型语言,从而重新桥接第一人称与第三人称研究,这种新取向也可以被称为继神经现象学后的一种方法:数学神经现象学或计算神经现象学。自由能原理和预测编码理论,作为解释生命和意识影响力较大的研究框架,自然也不会缺席。就在 Johannes Kleiner 提出结构性转向的几乎同一时间,FEP的领衔人物 Karl Friston 和 Anil K. Seth 于2024 也发表了一篇论文:《A Mathematical Perspective on Neurophenomenology》,将现象学内容形式化为一种信念概率分布。这意味着数学结构性方法在 FEP中的应用和实证也已经开始。下面是论文的全文翻译:

意识科学的结构性转向(Towards a structural turn in consciousness science)
十三维,公众号:集智俱乐部超越功能主义:意识科学的数学结构性转向

一、 引言(Introduction)

1.1 背景与相关工作

计算(神经)现象学(Computational (neuro) phenomenology)

本研究属于计算(神经)现象学研究项目的范畴[1-3]。在意识研究领域,一个关键挑战是如何严谨地概念化第一人称现象学描述的生活体验及其与第三人称对大脑和身体活动或动态的实证测量之间的关系。第一人称视角关注的是"现象学"这一领域,它致力于对各种意识体验进行严格的描述性研究,概述每种意识体验类型的本质或必要属性[4]。

现象学的创始人曾试图将他们对意识的描述性研究与神经或身体相关因素和原因分开[5]。但说现象学先驱对大脑/身体与意识体验之间的关系不感兴趣是不公平的(例如见[6])。在现象学传统本身内[7],一个被称为现象学心理学[8,9]的分支学科一直关注将大脑和身体中的现象(以第三人称方式)与意识体验的展开(以第一人称方式)明确联系起来;关于方法和问题的综述,请参见[10-12]。

自1990年代以来,人们对将生成定性数据的第一人称现象学方法与用于测量和量化大脑活动的神经科学技术明确结合起来的兴趣和协调努力有所增加[13]。"神经现象学"研究项目最初由 Varela提出[14,15]。这种对意识研究新兴领域的新颖方法基于这样一个前提:该领域的进展需要整合详细的定性现象学数据和产生定量神经生物学数据和模型的第三人称实证方法。

使这一领域有别于既有领域如心理物理学的是其对"生成通道"的强调:明确将第一人称和第三人称方法联系起来的相互约束和良性信息循环。神经现象学与其他方法的不同之处在于它旨在建立这种生成通道,神经生物学数据和模型受到第一人称现象学方法的模型和数据的约束,同时也约束后者,而不是提出一种可以区分有意识和无意识信息处理的理论,或仅仅提出第一人称和第三人称描述之间的同构关系。数学语言将提供一种在这两个领域之间的本体论中立的桥梁;在其最初的表述中,动力系统理论的数学被视为特别适合作为桥梁[16]。

正如 Varela所写:"一种更为严格的方法要求将同构思想向前推进一步,提供一种通道,在这种通道中,相互约束不仅共享逻辑和认识论的责任,而且还要求在操作上具有生成性,也就是说,在整个现象领域内,这些领域之间有相互循环和启发。这就是说,我们必须准备好处于这样一个位置:以明确的方式生成(以有原则的方式)约简分析[即,对生活体验的第一人称描述]和本质描述[即,对意识体验类型的必要属性的描述],这些描述植根于生物学涌现"[17],强调部分为作者所加。

尽管 Varela及其同事做出了详细的概念性进展,成功地促使意识重新成为科学调查的有价值或不受怀疑的主题,但如何以有原则的方式形式化生成通道的问题仍然是一个热烈争论的问题——以及一个相对开放的挑战。

理论神经科学与预测处理(Theoretical neuroscience and predictive processing)

幸运的是,近几十年理论神经科学领域在认知系统建模方面取得了几项基础性进展,这些可以在计算(神经)现象学中加以利用。在本文中,我们利用贝叶斯框架,将大脑功能——更广泛地说,认知——视为推理过程。具体来说,我们关注自由能原理[18,19]、贝叶斯力学[20]和主动推理[21,22];简而言之,前两者指的是统计物理学中描述与环境互动的事物、生物体或智能体参与推理的原理和一系列结果;后者是一个利用这些结果对认知和行为进行建模和模拟的框架。我们将在第2节中对这些进行回顾。

相关工作(Related work)

计算(神经)现象学包含许多不同的计算方法。

与我们工作最相关的是[1-3],它利用上述贝叶斯框架对主观体验进行建模。他们提出,一旦将给定类型的现象学体验形式化,该形式描述就可用于约束可能实现、实施或以其他方式使该类型体验出现的神经活动可能模型。然而,这些工作未能展开表征现象学的数学工具、第一人称和第三人称描述之间的生成通道形式,以及相互约束它们的数学装置。相反,他们专注于通过第一人称现象学方法描述的第一人称体验本身提供主动推理解释。有关应用于注意力集中现象学的实际示例,请参见[3]。

其他方法使用神经网络模型来模拟特定形式的视觉现象学。Suzuki及其同事通过改编经典的深度卷积神经网络(AlexNet[23])来模拟视觉幻觉的现象学,展示了这种方法[24]。这种方法最近通过使用耦合的判别和生成神经网络,将模拟的现象学针对来自不同病因的不同类型的视觉幻觉而扩展[25]。尽管这种一般方法受到感知贝叶斯视角的启发,但并未直接使用自由能原理或主动推理提供的数学工具包。

1.2 论文范围与贡献

在本文中,我们从数学角度发展计算(神经)现象学。我们采用贝叶斯方法处理(神经)现象学,并探讨这一特定视角的含义和机会。具体而言,

1. 我们揭示了一套可用于表征现象学的数学工具,提出了几个待未来工作测试的假设,以及

2. 我们概念化了第一人称和第三人称描述之间的生成通道形式,以及相互约束它们的数学装置,以及未来研究方向。

我们通过利用上述认知预测处理框架来实现这一点。此外,我们采用了指导先前在利用这些框架的计算(神经)现象学工作中的相同操作假设[1-3]:我们假设第一人称体验的内容可以被形式化为(或关联到)一种信念(即概率分布),这种信念编码了智能体关于外部和内部世界状态的当前最佳猜测以及相应的不确定性。贝叶斯力学然后授权这样的观点:这种信念通过近似贝叶斯推理不断根据感觉数据进行更新。

1.3 论文结构

第2节:我们通过回顾信念更新统计物理学的近期进展(称为贝叶斯力学)设定舞台,这是我们在主动推理框架下建模(神经)现象学的起点。这提供了对现象学描述的初步数学形式化:第一人称体验的动态和内容可以被形式化为一个信念更新过程,该过程根据先验信念和传入数据塑造后验信念。

第3节:我们通过首先检验后验信念的瞬时快照(可能对应于第一人称体验的一个时刻),然后讨论其时间动态,以及这对现象学的代谢成本和时间现象学的影响,来揭示这一定义的后果。

第4节:最后,我们考虑在这一框架中如何实现生成通道;也就是说,第一人称体验如何与大脑活动的客观测量(如神经元发放率)相关联,重述主动推理和实证神经科学中的先前工作。

二、自由能原理(The free energy principle)

2.1 贝叶斯力学

2.1.1 高层概述

贝叶斯力学是一个物理学领域,它从世界是随机动力系统这一前提出发,最终将世界中的事物——比如老鼠和人——描述为参与推理的过程。请注意,我们在本文中不对生物体实际实施推理过程做任何本体论声明;相反,我们的主张是它们的动态可以被描述为或解读为推理过程:

随机动力系统 ——→ 数学理论——→ 推理描述 (1)

自由能原理(FEP)是连接这些结果的共同线索,即这些推理过程采取在自由能泛函(又称证据下界)上的梯度下降形式,与统计学、机器学习和理论神经科学中的变分贝叶斯推理一致[26,27]。

贝叶斯力学的推导始于对事物如何与环境互动的基本描述——从无生命的石头到复杂的生命体——即,它们的存在意味着一个边界,将内部与外部分开,通过这个边界,内部和外部的状态相互作用。它最终将事物描述为编码关于其外部和内部世界(例如,它们的身体或大脑)状态的信念,并且有这些信念所通知的动态。其结果是,信念更新实际上是(几乎)任何物理事物的一个属性,因为它通过边界与环境互动。

2.1.2 细节阐述

简而言之,一个事物——比如石头、老鼠或人——之所以存在,是因为它在持续存在的时间尺度上可与周围环境区分[28]。这种可分离性意味着存在一系列构成边界的状态,这个边界既分离事物,又将其与其他一切相连。包含该事物的系统(即世界)因此可以分为三组状态:属于环境的外部状态s,属于事物的内部状态μ,以及属于边界的毯状态 b。

数学上,这个边界是内部和外部轨迹之间的马尔可夫毯。这些轨迹相互作用,使得外部状态对内部状态的任何影响必须通过毯状态发生,反之亦然(见图1左侧)。也就是说,给定毯状态,内部和外部过程是条件独立的。

(图1:马尔可夫毯与贝叶斯力学:此图显示了动态演化的外部状态s与内部状态μ之间的分离,其中所有交互都通过边界或毯状态b进行中介。左图:我们看到动态在因果网络中随时间演化,其中外部变量以白色表示,而属于生物体的变量以蓝色表示。右图:马尔可夫毯被分解为感觉和主动状态,其操作定义分别为不受内部和外部状态影响的状态。绿色箭头说明内部状态μ可被描述为编码关于外部世界状态的信念(即概率分布)q_μ(s),这些信念近似于给定感觉状态o的真实后验信念,并且与预测处理、统计学和机器学习中的变分推理一致地更新)

毯状态本身可以根据它们对内部和外部施加的影响来划分。边界由感觉状态o和主动状态a(可能为空[29])组成,其中主动状态可以影响环境,但反之则不行,而感觉状态可以影响内部状态,但反之则不行(见图1右侧)。在这个框架中,惰性粒子如石头只是没有主动状态的事物(但放射性石头有主动状态)。

将系统划分为具有毯、内部和外部状态的粒子或事物被称为"特殊划分"[19,30]。特殊划分允许我们将事物的动态解释为对其感觉状态的原因进行推理。具体来说,内部状态编码关于外部状态的信念,意思是它们参数化关于外部状态的贝叶斯信念(即概率分布)[31]。(应当指出的是,这里的"信念"一词是在贝叶斯信念或概率分布的技术意义上使用的;它们不一定等同于哲学中使用的术语含义,表示具有真值条件的命题态度[32]。非正式地说,自由能原理的含义是,如果我们考虑的系统有一个特殊划分,如上所定义,那么我们可以将内部状态写为外部状态的估计器[33])。更技术性地讲,给定固定的感觉状态,存在一个从内部状态到近似后验信念的映射,使得与最可能的内部状态对应的信念非常接近(或相同)于真正的后验信念,给定感觉状态。简单来说,[19,20]¹

此外,可以证明内部和主动状态通过最小化一个被称为(变分)自由能的量而演化

变分自由能中的第一项是生物体关于环境的信念与真正的后验信念之间的差异——用Kullback-Leibler(KL)散度[34]测量。最小化这一散度确保生物体关于其环境的信念在可用证据的光照下不断更新。第二项——p(b,μ)——是生物体状态的证据,如果我们将p(s,o,a,μ)解释为环境中的状态如何影响生物体状态的生成模型;也就是说,一个关于环境如何影响生物体的生成模型。换句话说,生物体的动态最大化其自身状态根据生成模型的证据——一种有时被称为自我证据的描述[35]。下面的等式总结了模型证据:

在物理学文献中,p通常被视为描述系统的过程密度动态的稳态解,即描述系统的过程的非平衡稳态[19,20]。假设存在这样一个p意味着我们正在研究的系统在感兴趣的时间尺度上是自组织的,而不是耗散的。但这一假设通常不必要[20,29]。最终结果是,大多数存在的事物,更不用说自组织的事物,都可以被描述为拥有关于世界的信念,这些信念通过最小化自由能来演化,以理解传入的感觉数据。

2.1.3 关于(内感受)推理和现象学的评论

在这一点上,有几点需要说明:

异型事物(Different kinds of things):在贝叶斯力学中,异型事物[29,36,37],无论是在其动态上还是在其隐含生成模型的结构上有所不同,都可以通过它们(可被描述为)编码的关于世界的信念来表征。确实,有些事物编码简单的信念,而其他事物则编码复杂的信念,这意味着它们可能携带关于外部世界的少量或大量信息[31]。

内感受推理:鉴于推理是由内部状态对外部状态进行的,人们可能会想知道内感受推理,例如关于大脑和身体的推理,如何适应这一图景[38,39]。答案是推理取决于我们在哪里划定马尔可夫毯。在这个框架中,每个生物体,即使是一个细胞,都有自己的马尔可夫毯,而像我们这样的复杂生物体是由多重嵌套的马尔可夫毯形成的[40]。这意味着大脑可以对身体、身体的环境以及大脑的组成部分对大脑的其他组成部分进行推理[36,37]。

现象学:在本文中,我们假设现象学,即体验的内容,编码在生物体的信念中。我们将此作为一个桥接原则来表征现象学并提供生成通道,为意识科学提供一个有用的理论。我们不对现象学内容可能存在于生物体信念中的何处做出具体声明,这将构成一个适当的意识理论(注意,在其他地方正在朝这个方向迈进[37,41-43])。

2.2 主动推理

贝叶斯力学和自由能原理构成了一个框架的基础,该框架系统地建模和模拟事物(可能对应于认知和行为)的内部和主动动态,这被称为"主动推理"[21,22,32,44-46]。回顾主动推理超出了本文的范围(请参见上面引用的优秀专著),但该框架可以有用地总结如下:主动推理在某种意义上是自由能原理的逆;在主动推理中,人们指定一个关于外部世界如何引起事物(通常是生物体)的感觉状态的生成模型,然后通过最小化自由能来模拟随之而来的认知和行为过程(如行动、感知、学习等)。

主动推理是一个非常通用的框架,用于建模看起来像是在推理其感觉扰动原因的系统:人们可以看到这一点,因为自由能最小化描述了在非常一般的条件下事物的动态或行为,参见第2.1节。主动推理的一个美学优势在于其简单性,通过将生物体的所有复杂性总结到一个生成模型中,通过优化一个独特的目标——变分自由能[18]——所有的认知过程,包括感知、学习和决策,都是模型的函数。换句话说,在主动推理中,生成模型承担了所有的重担:区分不同事物的是它们的生成模型形式(以及用于反演模型的观察)。

三、现象的数学特征

(Mathematical characteristics of phenomenology)

我们基于贝叶斯力学和主动推理的现象学研究建立在一个基本假设之上:

假设3.1(核心方法论假设)。

计算现象学的主动推理解释的核心假设是,我们可以将体验的"内容"建模为一种近似后验信念 q_μ。在这一假设中,智能体的现象学体验被形式化为由该智能体的内部状态编码的信念,这种信念基于其在每个时间点上的感觉状态。请注意,我们并不假设所有信念都伴随着现象学体验,而是认为所有现象学体验必然涉及由某种内部状态编码的信念。这意味着,意识内容的任何变化必定源于身体、大脑和/或世界推理状态的变化,但反之则不一定成立:推理状态的变化不一定总会导致意识内容的变化。(关于支持这一观点的方法论和哲学讨论,请参见[1, 2]和[47])

我们现在通过几个例子来阐释这一假设的含义,并以此发展将在未来工作中测试的现象学假设。首先,我们将形式化体验的一个时刻,然后转向体验的时变动态——理解为时刻的连续序列。(我们注意到,在这两种情况下,我们都关注的是现象学的内容。时刻与动态的区分不应与现象学文献中使用的静态与发生现象学相混淆)。这为量化时间现象学及其代谢成本提供了假设基础。

(图2:信念空间上的现象学与动态:此图展示了现象学作为关于我们感觉信息原因的信念,这些原因可能在身体内部或外部。这一信念被动态更新以近似后验分布(左上)。下图:关于一个这样的因果变量s的四个主观信念。这里,它们是高斯分布。它们的参数(均值和标准差)被绘制在二维半平面上(右上)。橙色箭头说明了现象学(概念化为我们的信念)动态变化的事实;这种动态可以被可视化为这个参数空间上的动态)

3.1 现象学时刻(A moment of phenomenology)

以下是一种数学方法,用于描述已经完全构成或展现给意识主体的客体的现象学,在单一时间点上。考虑这个问题:"你对当前温度的体验和我的一样吗?"这指的是当我们双方面对直接反映给定温度的环境感官输入时,我们各自的体验。在这里,我们的体验被形式化为关于外部世界的信念,给定感官输入。并且请记住,我们的信念会随着新的感官信息的输入而演化,以最小化自由能,也就是说,基于我们的感官输入和先验信念,最佳地表征世界。

询问"我们在采样相同温度后对当前温度的感知有多不同"相当于询问我们在经过相同感觉后对外部世界的信念有多不同。由于我们的信念向自由能最小值移动,问题就变成了"在采样相同感官世界后,我们的自由能最小值是否也相同,如果不同,它们相隔多远?"

基于计算现象学的核心方法论假设,我们已经将关于温度的感知差异这一问题重新表述为一个关于两个后验信念如何不同的数学陈述,基于相同的感官数据;等价地,各自的自由能最小值相距有多远。然后问题就变成了如何以有意义的方式测量信念之间的距离,或自由能最小值之间的距离。

幸运的是,有一个称为信息几何[49,50]的成熟数学分支专门研究这个问题:我们如何测量信念之间的距离?为了介绍基本观念,让我们看一个直观的例子。假设有四个人坐在寒冷的冬日外面。我们将这些人标记为蓝色(●)、绿色(●)、橙色(●)和红色(●)。蓝色和绿色的人认为(体验到)温度是-2°C,而橙色和红色的人认为(体验到)温度是2°C。绿色和红色的人对温度非常有信心,而绿色和橙色的人则信心少得多。

为简单起见,让我们假设每个人的大脑可以被描述为编码了关于温度的高斯信念,其中均值对应于对温度的最佳猜测,标准差对应于不确定性。具体地说,我们假设信念由图2中的相应分布给出。如果我们现在问他们的温度感知在此刻有多不同,例如,绿色与橙色的感知是否比蓝色与红色的感知更多或更少不同?直观上,通过查看图2的底部面板,我们看到蓝色和红色的各自感知比绿色和橙色的各自感知要不同得多——因为绿色和橙色的信念共享更多信息。另一方面,当我们在平面上绘制四个信念的参数(均值和标准差)时,我们看到蓝色和红色,以及绿色和橙色是同样不同的信念对。这个故事的寓意是,计算信念之间距离的简单方法(即通过计算参数之间的欧几里德距离)没有考虑到各自(假设的)感知的差异,或信念所传达的信息,而这正是我们想要在这里量化的。结论是,我们需要重新思考如何计算信念之间的距离,以有意义地考虑这一点。

3.1.1 测量第一人称体验的差异

我们专注于客观测量现象学差异。也就是说,我们测量两个信念——由两个不同实体共享,或由同一实体在不同时间点共享——在数学意义上的差异程度。这实际上比找出两个感知被意识主体感知为有多不同的更广泛的问题,我们将其称为现象学中的主观差异。我们将在后面回到主观差异的问题(见第3.1.1节)。

原则上,任何信息度量或散度都可能适合客观测量两个信念之间的差异,这取决于我们有兴趣表征现象学的哪些属性。基于测量第一人称体验之间距离的动机,我们详细阐述了可能是测量信念之间距离最自然的方式,即通过它们的信息内容差异。这是用Fisher信息距离[51]量化的。

Fisher信息长度和距离:为了介绍Fisher信息距离,回想一下概率分布之间的特权差异度量:KL散度。KL散度不是一个距离,因为它在输入上是非对称的。

然而,当参数中的两个分布无限接近时,KL散度变成对称的。解释其原因,设μ是概率分布的参数(在图2的例子中,这是均值和标准差μ = (m, ς))。例如,可以从KL散度围绕其第一个参数的二阶泰勒展开中看到这一点(即,作为参数小变化dμ的函数,其中μ是固定的)

其中,根据定义,...中的项在当分布非常接近时,也就是当dμ足够小时,相比前导项是可忽略的。第一项为零,因为两个相同分布之间的KL散度为零。第二项也消失,因为当参数相等时,KL散度最小。这留下了通常非零的第三项,它是对称的,在两个信念之间的参数的无限小差异中是平方的。因此,只在局部有效的距离的有意义定义由下式给出:

关键是将这一局部定义扩展为全局定义。构造遵循一些通常的步骤:距离(或任何其他函数)在无限小小的行进方向上的无限小增量可以通过路径积分在任意长的轨迹上累积。因此,我们可以定义信念轨迹的(Fisher)信息长度ℓ,也就是一个赋值t → q_μt,其中t ∈ [0, 1],通过:

从这里,很容易定义概率分布之间的(Fisher)信息距离[51]:两个信念之间的信息距离是它们之间最短轨迹的信息长度。

也许令人惊讶的是,信息距离有时可以以闭形式表达。当信念是单变量高斯分布N(m, ς)时,我们有[51,等式9]

这允许我们总结我们的例子,其中 :

因此,我们已经表明,蓝色人的感知与红色人相比,比绿色人与橙色人的感知更加不同。这些感知之间的距离以nat表示,即自然信息单位。特别是,蓝色和红色的感知比绿色和橙色的感知不同三倍多。注意,信息距离敏感地依赖于各自信念的方差或精度。这意味着改变每个信念的信心(即精度)而不改变其内容(即均值),可以严重改变信念之间的距离。

作为参考,Fisher信息距离有时但并非总是在多变量高斯分布的情况下有闭形解;这取决于参数的均值和精度,详见[51]。当信念是类别分布q_μ(s) = Cat(s | μ)(其中μ是一个有限维向量,其非负项总和为1,表示各种事件的概率)时,Fisher信息距离为[52,附录]。

信息几何:展望未来,不仅有可用于信念的距离概念,还有整个几何学,意味着人们可能能够计算角度、投影和许多其他事物[49,50,53]。技术上讲,Fisher信息度量是一个黎曼度量,因此黎曼几何中可能的一切在这个上下文中都适用;当人们添加我们处于概率分布空间这一事实时,这个空间本身有一些额外的结构,一起导致丰富的信息几何工具箱,可以应用更多内容。

3.1.2 更广泛的影响

从长远来看,信念的几何学将允许我们精确地表征主体之间的现象学差异。例如,一个人的现象学可以通过在给定刺激下具有特征性区域内的信念来表征。注意,神经类型性应该被认为是属于一个区域而不是单一点;这强调了存在许多成为神经类型的方式,以及"感知多样性"可能是一种广泛但被低估的现象[54]。这一框架对计算精神病学有影响,其中异常现象学(如妄想)可以被描述为处于大多数主体特征现象学空间之外,并因此产生负面后果。可能精确地根据它们的数学接近性来表征精神病体验,这可能为具有相似主体的有针对性的专门治疗提供信息。这是计算精神病学的自然下一步,它已经将精神病体验建模为异常信念[55, 56]。

到目前为止,我们已经探讨了如何测量现象学的客观差异:即,给定两种体验,它们在信息内容上有多大差异。一个相关但不同的问题涉及现象学的主观差异:给定两种体验,它们对体验者来说有多相似/不同?

对于后一个问题,使用实证相似性判断来推理最能描述大脑如何测量感知之间差异的散度将会很有趣[57](注意,所有距离本身都是散度[50,58])。Tversky[59]已经注意到主观相似性判断可能违反度量公理中的对称性和三角不等式,这表明一个不是距离的散度可能更适合量化这些现象学特性。这提供了替代现有量化主观相似性方法的假设,这些方法(例如)使用量子几何[57, 60]来解释这些违反,或假设相似度是作为距离的指数衰减函数计算的[61]。

从这种建模主观体验的方式中得出的可测试预测——假设客观(如本节所测量的)和主观感知差异之间存在相关性。例如,如果我们将注意力构想为(直接或间接)调制后验信念的精度[62-64],那么不被关注的刺激将被感知为不如被关注时的相同刺激那样相似。这可能通过在双任务条件下做出的感知判断的相似性判断来测试,其中注意力可以被选择性地撤回[48, 57]。这一观察的另一个角度是信念的精度可能反映在主观信心中[65-67]:信念越精确,人们对基于该信念的推理表达的主观信心就越大。一个类似的假设将会是:即使对于相同的刺激,当信心更高时,感知也会被判断为不那么相似。

3.2 动力现象学(Dynamic phenomenology)

我们所用的术语"动力现象学"指的是我们的感知(体验内容)如何随时间变化。我们已经看到,信念在给定感官输入的情况下向自由能最小值移动。然而,由于感官输入不断更新,自由能最小值也在不断演化。即使一个智能体接收到一条新的感官信息片段后再无输入,其信念仍然需要沿着某个轨迹向自由能最小值演化。问题则变成:当新的感官信息被采样时,我们的信念如何随时间演化?

关键在于表征信念向自由能最小值的轨迹。做到这一点的一种方式是测量轨迹的信息长度(参见第3.1.1节)。

这个量至关重要,因为它量化了信念更新的计算成本,也就是说,更新信念以理解传入的感官数据——并达到"最佳猜测"的成本。实际上,Fisher信息长度量化了信念在其轨迹上移动时被更新的自然信息单位(nats)的数量。此外,单位时间内的信息长度变化与信念的精度密切相关,因为精度决定了Fisher信息度量,正如我们在第3.1.1节中所见。这表明在信念更新过程中注意力与信息长度积累率之间存在合规的关系。我们现在来考察信息长度、能量消耗和持续时间的主观体验之间的联系。

3.2.1 现象学的代谢成本(The metabolic cost of phenomenology)

关于Fisher信息长度,有一个有趣的视角,它与推理的计算成本是双重的。信息长度测量了智能体沿特定轨迹更新其信念所耗费的最小热量或能量。这源于朗道尔原理的直接应用[68]。当然,现实中的生物体的运作效率远低于此;也就是说,它们消耗的能量比朗道尔极限多出数个数量级。然而,我们假设主体信念所遍历的信息长度与它们更新这些信念所消耗的能量之间存在相关性。

这一点的一个理由在于计算神经科学最近的工作,显示了认知耗力任务与神经群体动态的熵产生之间的显著相关性[69]。熵产生量化了神经群体在认知活动中耗散的最小能量,或散发的热量。信息长度与熵产生之间存在紧密关系,可以说它们是同一枚硬币的两面:前者是信念动态的最小能量消耗,而后者是编码这些信念的神经动态的最小能量消耗。实际上,随机过程理论告诉我们,随机动态的熵产生率与相关概率分布的信息长度率之间存在对应关系,例如[70]。总结如下:

我们从现有实证工作结合理论考虑推理出左上方的联系;但这需要有针对性的实证调查。

这种假设的关系引发了一个问题,即信念更新的代谢成本约束是否与认知努力的主观概念相关。测试这一点的一种方法是推理主体用于建模特定实验范式的生成模型(更多内容见第4.2节),并比较认知努力的主观判断与信念更新的信息长度。我们相信这一领域有潜在的进展空间,因为现有尝试使用信息论工具建模认知努力是以先验与(近似)后验之间的KL散度表示[71, 72],这可以看作是信息长度的一个计算上简单的代理,而通过(11),信息长度可能是信念更新和现象学的真实代谢成本的更接近的替代物。

3.2.2 时间现象学(Phenomenology of time)

我们现在转向另一个应用实例:时间感知的现象学,特别是持续时间的体验。这里的假设是,某些感知推理序列过程中的Fisher信息长度可能适合量化持续时间的主观体验。

时间感知,作为人类体验的基础,传统上被解释为通过诉诸内部"时钟"来解释,这些时钟试图追踪物理的、客观的时间[73-76]。最近,一个替代提议出现了,它认为主观持续时间可以通过感知处理中积累的显著变化来解释[77]。Roseboom及其同事通过使用端到端计算模型来证实了这一提议[77]。他们将一个预先训练的图像分类网络(AlexNet[23])暴露于视频片段,并通过在网络的各个层级阶段中积累动态"显著性阈值"被跨越的次数来模拟主观时间。在他们的模型中,显著性通过网络给定层内的连续激活模式之间的欧几里德距离来测量。当网络任何给定层中的这种显著性度量超过任意阈值时,就会累积一个主观时间单位[77, p2]。在这项工作中,注意力被视为调制这一显著性阈值:低注意力意味着高显著性阈值:当我们不注意某事时,我们不太可能注意到它的变化,但大的变化仍会被注意到,反之亦然。特别是,低注意力意味着更短的主观持续时间,反之亦然。他们的模型能够准确预测人类对相同视频的持续时间判断,包括特征性偏差(高估短持续时间和低估长持续时间)。

值得注意的是,当模型活动被相应的(感知)大脑活动替代时,在功能磁共振成像中记录的准确预测仍然可能[78]。这表明该模型正在识别神经活动的相关特征,因此构成了一种计算现象学形式(尽管没有基于主动推理工具)。来自同一团队的进一步工作通过将时间感知与情景记忆联系起来扩展了模型——这一举动需要用预测处理模型替代AlexNet[79]。

在这里,我们根据贝叶斯力学提出了对这些发现的另一种解释。在更普遍的预测处理中,任何感觉刺激的显著性可以定义为这一特定刺激提供的信息增益。数学上,这是后验——在刺激o之后——与先验之间的KL散度:

但这正是观察后(比如在时间t)的自由能最小值与观察前(比如在时间t-1)的自由能最小值之间的KL散度。换句话说,观察的显著程度是信念在观察后在现象学空间中移动的程度。因此,计算显著观察相当于测量信念穿越现象学空间的速率。

我们提出,与体验一系列刺激相关的主观时间对应于信念在连续刺激冲击时所采取轨迹的信息长度。如果刺激是显著的,信念行进的更远,主观时间就会更长——反之亦然。

虽然这一提议仍然抽象,尚未在实证数据上进行测试,但它在各种方面补充了Roseboom及其同事的方法。首先,它不需要强加一种与显著性阈值及其随时间的多层次变化相关的单独机制。相反,显著性自然地从自由能最小化动态中涌现,因为它是信息增益的一个属性。显著的观察会对信息长度——从而对主观时间——做出高度贡献,反之亦然。

其次——相关地——注意力的作用是内在于主动推理方法的,在那里它对应于似然映射p(o | s)的精度[63]。在这一观点下,高水平的注意力意味着环境的状态精确地反映在观察中。在高注意力状态下,后验分布(信念)更加精确,即下面左侧面板的分布,而不是图2右侧面板的分布。当更精确的分布在现象学空间中移动时,我们会产生更大的信息长度,因此主观时间更长。

为了说明这一点,再次考虑图2:假设两个主体正坐在-2°C的寒冷冬日早晨。一个主体被要求注意温度,他们的信念由蓝色分布总结。另一个被要求不注意温度,他们的信念由绿色分布给出。时间流逝,空气温度升至2°C。在这段时间内,注意的主体将经历从蓝色到红色分布的信念转变,而不注意的主体将经历从绿色到橙色分布的信念转变。尽管两个主体都暴露在相同的刺激序列中,但注意主体的信念在现象学空间中行进得更远(以信息长度测量),因此注意主体将经历更多的主观时间——根据这一解释。

这里提出的方案缺乏Roseboom等人研究提供的细节和对实证数据的参与。进一步的研究可以有用地直接使用相同的数据比较这两种方法。此外,主动推理方法提供的分层生成模型[80]可能有助于解释我们的思想似乎注册的不同时间"粒度";非正式地说,我们似乎在不同的时间尺度上体验持续时间的方式不同[81]。可能,同时跟踪短时间跨度和长时间跨度可以被建模为在模型层次结构的不同层次上的信念更新的信息长度。这可能是测试我们假设并可能扩展时间感知相关工作的一种方式[77-79, 81]。

四、生成通道(Generative passages)

回到 Varela所提出的生成通道概念,问题是:主观第一人称体验的描述如何约束和影响第三人称中的神经生物学动态的客观测量?基于我们对现象学的假设,这个问题变成如何连接:

1. 第一人称的体验,它与后验信念的动态相关,这种动态来源于生成世界模型和自由能最小化,与

2. 神经动态,这些是客观的、可观察的,例如通过非侵入性神经成像。

我们认为主动推理可能适合作为形式桥梁。为此,我们回顾计算神经科学中的相关工作,并强调神经现象学的未来方向。

4.1 从信念动力学到神经动力学

(From 1st person belief dynamics to 3rd person neural dynamics)

首先,让我们从第一人称体验到第三人称的神经动态:自由能最小化的信念更新过程(即,我们对意识体验"内容"的形式化)如何蕴含神经动态?

在主动推理中,已有工作表明神经群体动态可以从自由能最小化方程模拟出来[82]。我们考虑最简单的例子,其中一个生物体被描述为以有限数量的可能状态表征其环境的一部分(例如,在某些视角下,由位置细胞编码的空间位置),技术上使用部分可观察马尔可夫决策过程(POMDP;[21,83])。在这种情况下,可以用以下方程描述其关于当前状态的信念更新在刺激周期时间内的过程[21]:

在这个方程中,σ是softmax函数,q_μ表示智能体关于状态的信念。这是一个由σ(μ)参数化的类别分布。明确地说,σ(μ)是一个向量,其第i个分量是智能体对处于第i个状态的信心(表示为概率)。Softmax函数是将自由能梯度映射到信念的自然选择,因为前者具有对数形式[21,等式8],而后者的分量必须总和为一。

神经元将突触后电压势转换为发放率,就像这些动态将一个实数向量μ转换为分量在零和一之间有界的向量σ(μ)。因此,自然地将μ解释为神经元群体的电压势,将σ(μ)解释为表示它们的发放率(因为这些由于神经元不应期而有上界)。我们现在指出这种思考方式的表面有效性。

4.1.1 表面有效性(Face validity)

状态估计可以用发放率表示的观点在状态空间构成空间的内部表征时是公认的。这是位置细胞[84]、网格细胞[85]和头方向细胞[86,87]研究的存在理由,其中推理的状态(在某些视角下)是空间中的物理位置[88]。猫的初级传入神经元也已被证明编码后肢的运动学状态[89-91]。最值得注意的是,Hubel和Wiesel[92]的开创性工作证明了编码视觉刺激方向的神经元的存在。简而言之,神经科学中感受野的存在本身就说明了世界在隐含的离散状态生成模型下被划分为离散状态。虽然这些研究中许多关注单个神经元记录,但所呈现的论点适用于由一个或多个神经元组成的群体。

第4.1节回顾的状态估计与神经动态之间的数学对应关系得到了各种理论和实证证据的支持。这种对应关系已被证明在被称为"典范神经网络"[93]的大类生物神经网络模型中在数学上成立。更一般地说,它与神经群体动态的平均场模型一致[94,95],其中softmax函数在将平均电位转换为发放率方面扮演相同角色。此外,已经证明方程(12)中的信念动态在计算上和代谢上是高效的,预测实现它们的过程——这里是神经元动态——也是高效的。实际上,对信念所走轨迹的信息长度的深入研究表明,这些轨迹很短,这意味着神经群体以这种方式更新信念所消耗的能量预计会很小。这与我们对自然神经和认知动态的期望一致,效率在整个进化过程中已被自然选择。最后,这种对应关系允许人们合成各种生物学上可信的电生理反应,包括局部场电位(见图3)、重复抑制、不匹配负波、违反反应、位置细胞活动、相位超前、θ序列、θ-γ耦合、证据积累、竞争到界动态和多巴胺反应转移[82, 96]。这些预测反应已在体外自组织执行离散状态推理的神经网络中得到实证验证[97]。

(图3:模拟的局部场电位。此图显示了在主动推理条件下模拟的局部场电位。这些电位是根据信念动态进行模拟的,即随着生物体对一系列刺激的采样,经验内容的动态演变。有关这些模拟动态的更多细节,请参见文献[82, 52, 98])

4.2 从第三人称到第一人称

生成通道的概念是双向的。现象学的描述应该为实证研究提供信息,反之,神经动态应该约束和启发现象学探究。我们认为采用贝叶斯力学作为形式桥梁能够实现这种双向生成通道,见图4。

上文中,我们简要描述了从自由能最小化的信念动态到神经活动的工作。现在我们转向相反的方向:神经动态如何对应于信念更新?这是建立从神经动态到现象学的生成通道的必要组成部分,其中现象学与信念之间的精确关系仍有待研究(参见假设3.1)。

(图4:生成性通道。这个图总结了以贝叶斯力学为形式桥梁的生成性通道,该桥梁连接现象学与内部(例如神经)动态。左侧:主体的现象学可以数学化地形式化为一种信念(即概率分布),这种信念由其内部状态编码。主体产生关于现象学的第一人称描述,这些描述随后可用于推理其真实体验。右侧:内部(例如神经)动态可通过神经影像学方法部分观察,其输出可用于推理真实的内部动态。中心:贝叶斯力学提供了内部动态与信念动态之间的对应关系。如果我们假设现象学内容可以被形式化为一种信念(假设3.1),这就构成了一个生成性通道)

从第三人称(神经)到第一人称(信念更新)描述,在本框架中对应于反向工程那种生成模型,它将被生物体所体现,对于这种生物体,神经动态和行为最小化自由能。

最近确立的是,一类被称为典范神经网络的神经网络动力模型——包括速率编码模型——可以被描述为在POMDP世界模型下变分自由能上的梯度流,就像方程(12)中一样。这种数学等价性可能是第一个允许我们从(广泛的)神经动态中获得隐含生成模型的等价性。此外,典范神经网络的参数与生成模型的先验一一对应。例如,发放阈值对应于隐藏状态和决策先验。换句话说,网络动态的不同参数化对应于在相同生成模型下具有不同先验信念的信念更新[98]。

这些观察转化为体外神经网络,其中已经证明,在接收感觉刺激后,神经元群体可以被描述为自组织(即学习)以推理隐藏原因,这与在POMDP生成模型下变分自由能最小化一致[97, 99, 100]。特别是,[97]表明,自由能原理预测了突触强度的轨迹(即学习)以及学习后的神经元反应,仅基于训练开始时的实证神经元反应,从中逆向工程了POMDP生成模型(包括先验信念)。这证实了学习后的神经反应对应于方程(12)中的动态。此外,[97]表明,体外网络基线兴奋性的变化与隐藏状态先验信念的变化一致(即状态先验),证实了隐藏状态的先验通过发放阈值编码。

这些发现证实,当外部原因是离散的时,许多类型的神经网络可以被描述为通过在POMDP生成模型下最小化变分自由能来进行贝叶斯信念更新而自组织。(这引发了同样的神经元网络是否也可以被描述为在外部状态连续时体现连续状态生成模型而自组织的问题)。总之,这种方法表明如何可能仅从神经活动逆向工程生成模型和伴随的信念动态。这构成了从神经动态预测现象学的生成通道,因为我们假设现象学可以被形式化为信念。

五、讨论(Discussion)

我们从这样一个假设出发,体验的内容可以被形式化为(或关联到)一种信念,这里的信念在技术意义上是指不断优化以根据新数据理解世界的近似后验概率分布,通过这一视角展开了贝叶斯力学和主动推理在神经现象学中的各种含义。相关的研究路线有以下几个方向:

计算现象学的方法论:我们工作的核心是方法论假设,即现象学与生物体信念中编码的信息相关(假设3.1)。这一前提是否恰当仍有待确定,因为这仍是一个争论的问题。这一假设使得贝叶斯力学和主动推理能够应用于神经现象学,从而产生一些特定假设——包括本文所描述的一些假设。遵循拉卡托斯的科学观点[101],

如果这些假设被证明是可测试的,并且测试能带来解释性洞见和预测能力,那么这种方法随着时间推移可能被视为有价值的。如果不是,则该方法将变得不那么有价值。我们希望这种方法在这方面具有成效,而不是退化。对这一评估的部分内容可能包括测试本文提出的特定实验预测,例如关于认知努力和时间主观概念的预测,通过行为实验,或通过与现有研究如[77]进行比较。

更多生成通道:关于主动推理提供的信念与神经动态之间的联系,过去几年的进展令人瞩目[97,99,102],然而,超越体外神经网络的进一步实证工作对于精确理解现象学的神经相关物仍然必要。针对这一点有两个互补的研究方向:首先是逆向工程复杂生物体如人类或动物所体现的(隐含)生成模型[103],这为基于这些生成模型下信念更新的个体特定现象学表征铺平了道路。这可以说是计算现象学的目标,可以在主动推理下通过比较模拟行为——在替代假设生成模型下——与实证选择行为,并选择具有最高模型证据的生成模型(即贝叶斯模型比较;例如[104])来实现。其次,除了本文讨论的类别信念动态(即离散感知)与相关神经动态之间的对应关系外,任何试图将神经与信念动态联系起来的尝试都面临一个实证挑战。要验证这种对应关系,需要将主动推理下生物体假设生成模型的模拟电生理反应与实证测量——以及替代理论——进行比较。详情请参见[97, 98]和[52,讨论]。

从桥接原则到意识理论:在本文中,我们将贝叶斯力学和主动推理视为桥接原则,以相互约束和丰富的方式连接现象学描述与机制描述(即生成通道)。这与意识"真问题"的方法非常一致,在这种方法中——不是提出意识的必要和/或充分条件——而是构建意识属性与机制属性之间的解释性桥梁[1, 47, 105-108]。这将主动推理定位为一种对意识研究有用的理论,而不是一种意识理论本身[47]。其他视角也是可能的,其中寻求进一步确定一个信念成为意识内容的必要或充分条件[36, 41-43]。这样做,可能会出现一组核心理论承诺,这组承诺将构成一个贝叶斯力学意识理论。无论事情如何发展,主动推理提供的数学和概念工具对揭示许多不同种类主观体验的神经基础具有巨大前景。

相关内容

热门资讯

沪指4000点攻守背后,A股下... 6月29日,A股走出一波罕见的“探底回升”的反转行情。 早盘,市场还延续前一个交易日的下跌惯性,上证...