允许自己犯错:成熟的大脑,只需要80% 的准确率

日期:2026-02-08 18:54:58 / 人气:5


为了解大脑如何构建用于解读世界的心理框架,得克萨斯大学奥斯汀分校神经科学与心理学教授艾莉森·普雷斯顿(Alison Preston)受邀与保罗·米德尔布鲁克斯(Paul Middlebrooks)展开对谈,一起探讨关于人类在日常生活中普遍依赖一种帮助我们组织与解释信息的心理框架,也就是图式(schema),是如何指导个体在不同情境下的行为的。
图式,作为认知心理学的核心概念,其经典范例是“餐厅图式”:当我们进入餐饮场景时,会基于既往经验自动激活用餐流程的行为预期与操作序列。尽管图式(schemas)曾经是一个心理学概念,神经科学家现在也开始接受这一观点。普雷斯顿团队通过研究海马体、前额叶皮层与顶叶皮层的神经活动如何相互作用,揭示了这些脑区协同工作可能构成大脑图式形成与结构化的神经机制。
致力于解析自由活动小鼠的运动皮层与基底神经节神经集群活动如何编码自然行为,于匹兹堡大学马克·萨默教授实验室获得认知神经科学博士学位。同时,他是播客节目《脑科学启示录》的主持人。
现任美国得克萨斯大学奥斯汀分校神经科学与心理学系讲席教授、副教务长。她聚焦记忆与推理的神经机制,创新运用功能磁共振(fMRI)与计算建模技术,系统揭示海马体与前额叶皮层协同作用如何支撑记忆整合、概念形成及逻辑推理,相关成果被《自然-人类行为》等顶级期刊收录,其研究获美国国家科学基金会杰出青年学者奖等20余项殊荣。
将心理学概念(如图式)与实际的脑计算机制联系起来总是充满挑战。因为大脑并非以抽象的图式进行思考。那不是大脑真正运作的方式。我们的大脑,特别是成熟的大脑(我的研究也涉及发展视角),它们的目标是力图在大部分时间(大约80%的时间)内做出正确的判断。它们会构建关于世界的启发式模型(heuristic models),以便引导我们在大多数情况下做出适应性的行为。
大语言模型(LLMs)的价值在于其提供了信息论框架下的预测工具:它能模拟大脑对刺激的高维编码(如细节丰富的初次感知)与后续低维表征(抽象化记忆痕迹)的转换阈值。通过量化分析语言模型对特定刺激的表征模式,我们得以建立其与人类记忆行为间的可计算关联,这为解析""刺激-记忆""的神经编码规则提供了新范式。
追问快读:
1.大脑并不是以“图式”为单位运作,这只是我们为解释行为而构建的模型。
2.人类数千年来一直在通过叙事操控记忆与认知。当情境发生变化时,基于常规图式的大脑会做出非适应性决策,因为它会对世界进行假设。这正是错误记忆的根源。
3.青少年倾向于强化分化存储策略,通过抑制重叠内容来维持信息的独立性。他们依赖的是分散化、低整合度的记忆网络,而非成人通过经验累积形成的优化图式系统。他们试图收集尽可能多的关于世界的信息,而不太关心情境之间如何相互关联。
4.更小的海马体(低维空间)反而支持更高效的推理。
5.即便你明确指导孩子这么做,儿童的实际应用倾向仍较低。他们存在一些根本性的局限,但你可以设定一个预期目标,引导其认知发展路径。
6.我接纳他们作为独立个体的存在,并理解他们的行为反应,并非针对我或我的教养方式,而是源于他们内在的神经发育进程。
保罗·米德尔布鲁克斯:今天我们将深入探讨一个既熟悉又神秘的概念——图式(schema)。你可能熟悉它、依赖它,但你真的理解它吗?图式存在于我们的大脑中吗?它如何塑造我们的实时认知?这个源自18世纪哲学家伊曼努尔·康德的概念(Immanuel Kant,他将图式视为先验心智框架),经过心理学家弗雷德里克·巴特利特(Frederic Bartlett)在1930年代的革新(用其解释记忆组织原则),最终在现代神经科学中焕发新生。
本次邀请到了得克萨斯大学奥斯汀分校的艾莉森·普雷斯顿教授,我们将一起从发展的认知神经科学视角,解析大脑如何通过不同神经环路实现图式计算,以及大脑在从童年到成年的发育过程中如何以不同方式实现这一点。需要说明的是,科学界对图式的定义尚未完全统一,但艾莉森提出的操作性定义因其能清晰区分图式与认知地图(cognitive maps)、概念网络及语义信息而极具启发性,这些认知构念常被混用,但其神经实现机制实则泾渭分明。
接下来,我们将更深入地探讨从儿童期到成年期的发展,大脑如何通过适应性神经重塑支撑图式运算,以及更重要的是,科学家究竟该如何量化测量这种抽象认知过程?
图式的定义:
什么是图式,什么不是图式
保罗·米德尔布鲁克斯:我们会使用一些概念作为工具用来理解心灵和大脑,图式就是其中之一,但它属于那些容易混淆的概念中的一个。我读得越多,可能反而越觉得自己理解得不够透彻。有时你谈论图式,有时你谈论认知地图,而现在我或许已分不清这两者的区别,也许你能帮我理清一下。
艾莉森·普雷斯顿:是的,我对“图式”的理解随着时间的推移不断改变。这一概念显然源自巴特利特在1920-30年代的开创性工作,但当今学界的使用方式已与其原意不同。我认为重要的是我们需要思考操作性定义(operational definitions)是什么,尤其是作为神经科学家,我不断自问:如何将心理学概念(如图式)映射到真实的脑计算过程?因为大脑并不是以“图式”为单位运作,这只是我们为解释行为而构建的模型。
保罗·米德尔布鲁克斯:诶,原来不是吗?
艾莉森·普雷斯顿:在实际的细胞信号方面,当然不是,但从它产生的结果来看,可能生成类似图式的功能。
保罗·米德尔布鲁克斯:如果大脑中没有图式,它仍然是一个心理学术语。
艾莉森·普雷斯顿:我认为如果要将图式与其他形式的概念,比如语义知识或概念,区分开来,有几个方面是需要考虑的。其一,图式不是一个时间点,其二,图式是一系列顺序的动作。你可以这样理解:我们常将图式和叙事(narratives)相提并论。当我们想到去机场,你对“去机场”这一过程就拥有一个图式。这涉及到安排交通工具或在机场停车,为这次旅行打包行李,甚至在去机场前几天发生的事情等等。
保罗·米德尔布鲁克斯:然后在出发当天的早晨,我会把行李放进汽车或交通工具里,无论是地铁、公交车还是开车去机场。当你到达机场时,你给帮你拿行李的司机小费,然后你进去,你办理登机手续······这就是常规流程,过安检后,我会在常去的咖啡店买杯咖啡,然后在固定区域候机。至于是否提前排队登机?如今几乎没人会坐在位子上等广播通知了。
艾莉森·普雷斯顿:我就是坐在位子上等广播通知的人。
保罗·米德尔布鲁克斯:真佩服你,我就没有那么耐心。我认为图式有一系列你期望的顺序动作,就像一个知识库,这就是它与概念不同的地方。概念不一定有事物应该如何展开的顺序例程和动作。
艾莉森·普雷斯顿:我认为图式应被用作预测模型,帮助我们理解基于既有规则(A→B→C),如何预判下一步行动并选择适应性策略。对我来说,图式超越了概念。你可以想象“狗”这个概念,它包含关联特征(毛发、四腿、吠叫等)与范畴结构(犬科动物),但这些静态属性集合无法等同于图式。图式的核心是动态的行动序列,而非特征的罗列。
保罗·米德尔布鲁克斯:从某种意义而言,图式与概念截然不同。作为心理学家,我们必须明确这些术语的操作化定义,并探索它们在大脑中的差异化表征。我认为图式必然包含时序性(至少部分程度),且与行动紧密绑定——无论是外显行为(如值机)还是内隐决策(如选择咖啡店),图式驱动着预测、选择与行为执行。
艾莉森·普雷斯顿:这可能不是一个完美的定义。我对图式的定义一直在为此演变,因为我认为还有其他形式。这正是我们心理学家觉得有点棘手的地方。比如有人提出“乔治·华盛顿图式”的概念(整合其总统身份、历史事件等关联知识)。
保罗·米德尔布鲁克斯:稍等,这里好像有问题。
艾莉森·普雷斯顿:是的,这里存在学术分歧,我不会称之为图式。我可能会称之为乔治·华盛顿的概念,因其本质是静态关系网络(如“总统”、“独立战争领袖”),而非动态行动序列。尽管有人持不同观点,但我坚持:图式需要是动态的、行动导向的,而“乔治·华盛顿”更符合概念的定义。
图式与认知地图的异同
保罗·米德尔布鲁克斯:我很喜欢刚刚的辨析!帮助我区分了什么是图式,什么不是图式。但最近我与研究人类情景记忆的学者西拉·格林(Ciara Greene)交流时,发现她对图式的定义与你不同。她认为图式更接近概念或认知地图,强调记忆元素间的关系网络。你可能认同这种关联性本身,但分歧在于是否将其归类为图式。
艾莉森·普雷斯顿:确实,我同意你说的。
保罗·米德尔布鲁克斯:是的,这就是图式在她的理论框架中的概念边界。而在你的定义中,这些关联性事物(associative things)需要完全围绕某个目标或在世界中推进的某种行动。
艾莉森·普雷斯顿:是的,我也研究过类别、概念以及认知地图,也仔细思考过这个问题,想区分它们的差异。我们可以这样理解:虽然认知地图和概念的定义同样复杂,但它们可以嵌入图式中运作。以刚才提到的机场为例,整个流程就是一个图式(值机→安检→登机),而其中的“去常去咖啡店”可能涉及认知地图(空间导航)或概念(咖啡偏好),但这些元素只是图式的组成部分。
保罗·米德尔布鲁克斯:你可以为咖啡店单独定义一个图式或概念,来指导你在其中的行为。但图式并非与认知地图或概念相互独立——它更像是层级结构中的上层框架,整合了这些子组件。若没有本质区别,为何需要两个术语?难道它们不是同一事物的不同名称?
艾莉森·普雷斯顿:这就是我认为图式与认知地图不同的地方,认知地图就像一组相互关系(interrelations),这些关系的来源不仅仅是直接经验,还包括事物之间推断出的联系。它本身不一定是静态的,但能提供事物间关系的全局图景,却不一定包含与之相关的序列性行动计划。
保罗·米德尔布鲁克斯:认知地图这一术语,通常认为是源自托尔曼(Tolman)对迷宫中的啮齿动物的研究*。这种理论本身蕴含动态性,就是说,当啮齿动物被允许在迷宫中自由探索时,即使此前未接受过任务训练,它们也能在迷宫中发现捷径并高效解决问题。托尔曼由此提出,动物大脑中存在一种内部模型,即认知地图,使其无需遍历整个迷宫即可推导出最优路径。这种动态性正是认知地图的核心特征。也因此,目前大部分研究集中在空间导航领域。
*研究来自:Tolman,Edward C.""Cognitive maps in rats and men."" Psychological review 55.4(1948):189.
艾莉森·普雷斯顿:确实,认知地图具有强烈的空间属性。
保罗·米德尔布鲁克斯:直到近期,通过你和蒂姆·贝伦斯(Tim Behrens)等人的研究,认知地图概念才被拓展至事物间及概念间的逻辑关系。或许直到最近,它的静态属性才得到更深入的探索。
艾莉森·普雷斯顿:这就是我要说的。也许我们可以把它看作是一个连续体(continuum)。也许认知地图和图式之间会存在某些重叠区域,但我认为认知地图的使用方式更灵活,它不一定存在一个你必须做的特定关系的顺序。就像迷宫中老鼠的行为一样,你可以根据需要随时调整路径、利用捷径;而图式在某种程度上确实与固定行为模式相关联。
重申一遍,根据我个人的定义,我试图围绕人类或啮齿类动物做出行动的内在心理方式来进行区分并理解,尤其是大脑神经如何运作的方式,如果我们想研究它们,就必须加以区分。这就是当前领域的现状。就像你说的,之前的节目嘉宾也许不会同意我的观点,但没关系,因为分歧反而能催生更多值得验证的科学问题,不是吗?
图式与记忆:
从图式的角度,为何人类会出现错误记忆
保罗·米德尔布鲁克斯:是的,之前节目嘉宾提出的核心观点在于,记忆具有重构性,这也是你在研究中所强调的。
艾莉森·普雷斯顿:没错,记忆是建构而成的。
保罗·米德尔布鲁克斯:我们讨论了我们记忆的各类缺陷。我们存在“错误记忆”的部分原因,在于当我们在处理并存储信息时,始终基于某种图式进行。图式的本质在于泛化知识。这可能就是你所说的整合过程。
艾莉森·普雷斯顿:这正是关键,整合过程会引发泛化。
保罗·米德尔布鲁克斯:因此,当你把某条知识纳入图式时,你实际上会丢失部分细节。
艾莉森·普雷斯顿:我认为认知地图也不能完全避免这个问题。我的理解是,虽然形成认知地图或图式的个体经验可能在记忆中逐渐消退,但这并不意味着图式中不再保留具体细节。这正是我们需要深入思考的地方。总体而言,我同意大脑,尤其是成熟大脑(这也是我研究的方向)的目标是在80%的情况下正确行事。
保罗·米德尔布鲁克斯:大脑构建世界的启发式模型(heuristic models),让我们在多数情况下做出适应性行为。因为大脑能力和资源是有限的,无法追求完美,它的必须依赖能“大多数时候正确”的算法。但代价是,这些适应性模型(比如图式)偶尔会出错,当你遇到大脑中存储的普遍规律之外的特殊例外时,就会判断失误。
艾莉森·普雷斯顿:问题在于,当情境发生变化时,基于常规图式(routine schemas)的大脑会做出非适应性决策,因为它会对世界进行假设。这正是错误记忆的根源,它是一种适应性假设,比如你认为“大多数情况下成立”,所以“现在也成立”。我认为错误记忆就源于此。
保罗·米德尔布鲁克斯:你基于联结网络做出预测,但在特定情境下,这种预测可能并不成立。但只要预测有用,是否绝对正确并不重要,对吧?
艾莉森·普雷斯顿:正是如此。错误记忆有时具有适应性,有时却完全没有,甚至可能造成一定危害。我认为我们的大脑正在使用其有限的计算能力来在大部分时间内把事情做对。这就是图式和认知地图发挥作用的领域。但硬币的另一面则是这些预测有时会出错。
青少年、儿童和成人在图式上的差异
保罗·米德尔布鲁克斯:我原本打算稍后再提这个,但既然你已提到成熟大脑,那我们就先聊这个。你刚才讨论的正是你研究的图式形成领域,以及发育过程中相关的大脑处理过程和脑区。这时我联想到你之前说的""成年人大脑的80%能正确行事"",这个比例具体如何体现?又比如青少年,你的研究显示他们会主动抑制过去的细节,而儿童则不会。这种差异的百分比分布是怎样的?让我们继续深入探讨这个问题。
艾莉森·普雷斯顿:我不是说大脑的80%,而是你做的80%的事情是对的,这更接近于适应性行为的范畴。在我们针对成熟个体的研究中,已证明这种知识形成过程,无论我们称其为图式或认知地图,部分依赖于海马体与其他结构的互动。海马体是非常著名的涉及记忆的重要脑区,它能够与前额叶皮层和顶叶皮层的其他结构互动,这些结构负责执行功能、高层次的决策过程等。
连接海马体与前额叶皮层的神经通路是大脑中最晚发育完成的部分之一,直到30岁左右才完全成熟。这对知识形成机制显然有重大意义。实际上,人类对大脑如何形成和运用知识的理解仍处于早期阶段,因为直到约20年前,学界还认为记忆系统在7岁时就已发育完成。直到最近,我们才修正观点,认识到记忆系统在青春期仍在持续发育。
我们仍有许多未知领域。必须强调,这是一个开放的研究方向,需要更多探索。我对发育中的大脑之所以有上述想法,是因为即使在青春期,海马体也不成熟。当我们学习新事物时,正如我的研究所示,记忆并非与过去割裂。即使此刻我们交谈时,当我和你讨论图式,你会自然联想到之前与其他嘉宾的对话。这不仅影响你当前的注意力,还塑造了你对我所讲内容的编码方式。
我们使用现有的知识来指导我们如何在新的经历中学习。然而,由于7至10岁儿童的海马体尚未成熟,他们的记忆提取过程在新学习经历中不会轻易激活先前知识,而更倾向于孤立地对待每段学习经历。如果想让孩子们意识到这件事与两周前在课堂上经历的另一件事有关,需要提供更多的外部提示。部分原因在于海马体的提取机制在儿童中期尚未成熟,无法建立有时间间隔的学习经历之间的关联。
保罗·米德尔布鲁克斯:用你的术语来说,儿童是知识的高度分化者(super differentiators),他们倾向于将经验拆解为孤立单元。
艾莉森·普雷斯顿:我正要谈到这一点。他们甚至缺乏经验间的再激活(reactivate),他们最终对相关经验形成正交表征(orthogonal representations),因为他们使用不同神经集群在不同时间进行编码。青少年则是矛盾的过渡者,他们的海马体开始活跃,比如说他们会回忆往期播客内容,但由于前额叶-顶叶的执行控制网络未成熟,他们无法有效整合信息,导致处理策略与成人截然不同。
作为一个成年人,会把这些经验联系起来,形成一个""图式中的图式""(schema of a schema)。青少年的大脑则选择抑制这些重叠信息。
请允许我将大脑的运作稍作拟人化比喻,当面对重叠的记忆内容时,成人的大脑会启动信息抑制机制,导致经验被存储为高度分化的独立痕迹。这一过程本质上是自上而下的认知调控。当相似经验引发记忆表征冲突时,成年人的前额叶会主导决策,选择通过重新联结(relinking)将碎片化信息整合为连贯的图式网络(例如将A→B与B→C的经验直接合并为A→C的关联),而青少年则倾向于强化分化存储策略,通过抑制重叠内容来维持信息的独立性,这种策略能避免记忆混淆,却需要付出更高的认知代价。
我的研究核心之一正是推断性推理(inferential reasoning)。在实验中,我常要求参与者通过联结不同时间的学习事件来调用知识。比如,我教你知道A事件和B事件相关联,之后你又看到B事件和C事件相关联。我会要求你推断出A和C之间的关系。儿童和青少年能够做到这一点,相比之下,成年人做这件事则要容易得多,因为他们在记忆中已经形成了A和C之间的直接关联。他们有一个可以用来推断的连接纽带,因此可以做出又快又果断的判断。儿童与青少年仍可完成,但需付出更多努力,因为他们拥有独立的记忆痕迹,无论这些痕迹是正交化(orthogonalized)还是真正分化的(differentiated)。
儿童和青少年会这样推导:既然A与B关联,B又与C关联,就必须依次从记忆中提取这两个独立事件,并在推理时进行实时重组。尽管最终可能得出正确答案,但这种认知路径需要付出更高的努力成本,且更容易出错。这并非认为儿童或青少年缺乏推理能力,而是强调其知识构建方式与成人存在本质差异。他们依赖的是分散化、低整合度的记忆网络,而非成人通过经验累积形成的优化图式系统。两者的决策过程植根于完全不同的知识基底,这正是我们当前研究的核心方向。
我们正在进行纵向研究,追踪青春期个体随时间推移在知识形成方式上的转变,试图揭示他们何时开始以不同模式构建知识。我们在实验中设计了没有明确正确答案的推理任务,所谓的“正确答案”实际上是用来对底层知识结构客观建模的工具。你做出的选择完全取决于你的知识结构本身,无关对错。
这表明如果个体在不同年龄阶段拥有不同类型的知识结构,其选择倾向自然会不同。这正是我们试图论证的核心观点。虽然我之前用育儿场景作类比,但关于青春期认知最精妙的洞见其实来自啮齿类动物恐惧条件反射研究,不知道你是否了解这类实验。
在经典恐惧条件反射范式中,研究人员将啮齿类动物放入实验箱并施加足部电击,动物会学会恐惧这个特定空间环境。在一项改良实验中,研究者分别测试了幼年、青少年和成年啮齿类动物的反应。当处于即时情境(immediate situation)中时,所有年龄组被放入实验箱时都会表现出僵直反应(freeze response),这是啮齿类动物对足部电击的典型恐惧行为。
实验的关键在于记忆检索阶段,也就是24或48小时后,研究人员将啮齿类动物重新放入原环境而不施加电击,观察其行为。结果发现,幼年组和成年组立刻表现出僵直反应,而青少年组却毫无反应。
保罗·米德尔布鲁克斯:我的天。
艾莉森·普雷斯顿:超级有趣的是,研究人员偶然将这些青少年期的啮齿类动物在成年后用于另一项实验。在该实验中,当时的青少年鼠已经成熟,研究人员碰巧地把它们重新放回那个环境,它们立刻触发了僵直反应。这说明那段记忆并非不存在,而是它们在青少年时期选择不去使用那段记忆。在后续的实验进一步表明,这种现象与海马体中的记忆抑制有关。这些青少年期啮齿类动物在提取恐惧情境时,会通过神经抑制机制阻断海马体的记忆提取。
并非只有我一个人认为青春期是一个探索的时期。那段时间你会试图收集尽可能多的关于世界的信息,而不太关心情境之间如何相互关联,这是在尝试整理一套关于这个世界是什么样的资料,这真的很有趣。后来,你可能能够解决这些事物之间的所有关系。但在青春期,你不一定会像利用已知信息那样去探索环境,而是尽可能多地探索环境。
保罗·米德尔布鲁克斯:主动抑制的部分真的很有趣。当你谈论那些啮齿动物研究时,我想到的是互补学习系统。我在想,也许发生的情况是,青少年时期的啮齿动物仍然在海马体中编码记忆。互补学习系统的理念认为,随着时间的推移,海马体才会将信息发送到皮层,而皮层需要很长时间来概括并将其编码到皮层中。我原以为,“嗯,可能就是这样。”但其实不是。
艾莉森·普雷斯顿:那些研究中并没有观察系统中的这种转变。但你刚才提到的观点很有趣。成年后记忆的调用可能不再依赖海马体,但记忆本身仍存留其中。我认为这种解释是合理的。至少在青少年期,恐惧记忆仍存储于海马体,只是被主动抑制;而当它们成年后被放回笼子时,是否需海马体重新提取?这一点尚不明确。
我认为研究者尚未通过特定实验操作来验证这一假设,但这仍是一个有价值的思考方向。记忆系统可能存在某种动态转化过程,可能与互补学习系统相关。这一观点非常值得探索。
保罗·米德尔布鲁克斯:青少年的行为本身,就表明了主动抑制肯定存在。
艾莉森·普雷斯顿:是的,没错。无论是回忆自己的青春期,还是观察家中青少年的行为,你都能发现——
保罗·米德尔布鲁克斯:你的孩子多大了?18岁?
艾莉森·普雷斯顿:18岁和15岁。是的。我看到我的女儿正在经历这种转变。我认为这是直觉可感知的。通过轶事证据(anecdotally),我们可以观察到类似""哦没错,这正是我孩子""的行为模式。我们可以凭直觉上知道这一点,但仍不清楚其成因、这种模式对人类大脑的适应性意义,以及具体转变的时间节点。我认为这对于理解如何教育孩子很重要,因为教育21岁大学生的方式应该与教育15岁孩子的方式不同,也应该与教育7岁孩子的方式不同。
思考这些问题时,为了让学习环境最具有适应性,你必须了解大脑在这个特定时间点的能力和倾向,这就是我们希望通过这项研究达到的目标。我还认为这对理解心理健康障碍和风险因素也很有帮助。我们所讨论的这些现象可以解释为什么青少年比其他人更具风险,因为他们非常具有探索性,他们不会利用已有知识或观察他人行为来获取经验,而是更倾向于自己亲身经历。
我认为这对于我们思考记忆系统在发展过程中如何运作和变化,对日常行为、童年和青春期的影响等问题有很多有趣的启示,希望我们能够对此进行思考。
保罗·米德尔布鲁克斯:从图式形成的角度总结,儿童期就像在努力推开认知之门,试图抓住事物的基本轮廓;而进入青少年期后,你已“半只脚跨入门内”,此时大脑开始主动抑制冗余细节,因为你已建立稳固基础,接下来要做的就是探索未知。
然后,探索模式大多在我们进入成年期时结束,此时的图式系统已经成熟了。
艾莉森·普雷斯顿:何谓完美或成熟,那就是你已经尽可能多地利用了所知道的知识来构建了一个具有适应性的图式,它能让你在80%的时间里做出正确的决定,并能接受20%的出错率。你的认知模式从追求掌握特定实例的详尽知识,转向建立尽可能普适化的知识基础。这正是我们讨论的转变过程。从心理学上讲,这是从拥有实例记忆到拥有完全连接性、适应性关系图式记忆的转变。
这就是知识迁移的核心。在某一情境中学到的内容,能无缝应用于其他所有相关情境。我认为这种能力的本质正在发生转变,从最大化地环境探索到成年期构建出了一个更具适应性系统。
图式的层次性:
既可以模糊,又可以清晰
艾莉森·普雷斯顿:我想指出的是,我之前提到过,我认为图式并不总是模糊的。
你会在图式中保留对行为至关重要的细节。其中某些部分可能被高度解析,而其他相对次要的部分在该图式中则可能较不清晰。
保罗·米德尔布鲁克斯:图式应该是可适应且灵活的,因为我们总是在更新它们,但是会存在某个特定图式,它的一些特征更加固化且适应性较差吗?
艾莉森·普雷斯顿:不知道。我认为你会保留图式中那些更明确的或者有助于区分在什么时候该做什么的部分。
保罗·米德尔布鲁克斯:你可以有一个餐厅图式,但可能还有关于餐厅的子图式。在一家快餐店的行为与在一家正式餐厅的行为是不同的。
艾莉森·普雷斯顿:它们有共同的特征,而且在餐厅里我的目标是进去给自己弄点吃的,这一点上它们有很多共同之处。你在餐厅里所采取的行动和做出的预测,会根据它是快餐店还是正式餐厅而有所不同。
这就像图式中那些用于区分不同决策选项的关键点会被高度解析。例如,在这种情境下我应该选择A,但在另一种情境中我就应该选择B,这正是图式需要更清晰表征的部分。而图式中关于快餐店与正式餐厅的相似性则会被压缩处理,因为两者的行为模式在本质上是一致的。
我认为,图式中解析度较高的部分实际上会直接导致不同的行为选择。
保罗·米德尔布鲁克斯:图式允许我们在新环境中泛化应用既有知识。例如,若我进入一家陌生餐厅,却因遵循旧有行为模式而引发社交尴尬,此时大脑会触发图式更新,你会意识到""我需要在此建立新分支,因为之前填充的,也就是当前行为模式在此情境下已不适用""。
艾莉森·普雷斯顿:这就是我认为的,人们拥有不同层次的图式,在不同的情境中区分不同的行为模式。比如我在机场的行为,独自旅行和与家人一起旅行时的行为模式就非常不同。这就是我要说的,并非图式具有极端模糊性。它们会在需要模糊(fuzzy)的领域保持模糊,在应当明确的领域则保持清晰
保罗·米德尔布鲁克斯:图式就像解决一切问题的答案。这也是这类理论的问题所在,你总想让它们适配所有问题。比如用它来解决这个问题,再用它应对那个挑战。但同样重要的是,我们要明确图式不是什么。
艾莉森·普雷斯顿:没错。
从图式的角度:
创造力到底是什么?
保罗·米德尔布鲁克斯:我想问,创造力在这套理论中处于什么位置?
艾莉森·普雷斯顿:这是一个极富洞见的问题!我们和其他人确实有一些数据,表明核心记忆功能与人们创新性思考的能力有关。创造力的本质,或许正是将看似无关的经验建立新联结的能力。
保罗·米德尔布鲁克斯:这种联结需要记忆表征对齐(aligned)还是正交(orthogonal)?
艾莉森·普雷斯顿:目前尚无定论。但可以肯定的是,经验再激活,如提取过去事件与新经验关联,是创造力的核心。因为这是你在""现在发生在我身上的事""与""之后发生的事""之间建立关联的过程。
或许可以用“再激活调谐广度”(the breadth of the reactivation tuning curve)来描述,即学习过程中再激活经验的范围大小,这可能与创造力直接相关。
保罗·米德尔布鲁克斯:从某种程度而言,远距离联结(即看似无关经验的关联)是最独特且最具创造性的联结方式。
艾莉森·普雷斯顿:我认为创造力的核心在于再激活的广度,即学习新经验时大脑选择唤醒多少过往经验。至于创造力所需表征应具备的高低维度,目前尚无定论。
保罗·米德尔布鲁克斯:肯定是高维的。
艾莉森·普雷斯顿:我不确定。我看到过一些研究提出了相反的观点。比如某些群体(如自闭症谱系)的低维表征反而与创造力正相关。
保罗·米德尔布鲁克斯:知道我为何如此确定吗?因为我本人就是高维思考者。
艾莉森·普雷斯顿:哈哈你说得对。高纬度表征假说成立,意味着青少年比成年人更具有创造力。
保罗·米德尔布鲁克斯:确实存在相关证据,但关键在于创造力的操作定义。
艾莉森·普雷斯顿:是的。这是一个复杂议题。我的团队虽未专注创造力研究,但确实有人观察到知识和创造力紧密相关。寻找其中的交集,是我们深入研究这个领域的原因。创造力和我们之前讨论过的关联记忆机制一样,本质上是关联性的。
保罗·米德尔布鲁克斯:有个经典说法:数学家过了24岁就“完蛋了”,因为他们创造力不足以解决新问题。这应该与创造力在图式理论中的位置有关,对吧?
艾莉森·普雷斯顿:是的。
流形的启示:
图式和认知地图表征的几何结构特性
保罗·米德尔布鲁克斯:那么图式不能做什么呢?它的局限性是什么?让我举个旁例说明。我们刚才好像在讨论流形(manifold)和低维性(low dimensionality)。你提到过“流形”这个词吗?我记不太清了。
艾莉森·普雷斯顿:是的,我有时候会用。
保罗·米德尔布鲁克斯::神经科学研究发现,记录大量神经元,例如100个神经元的活动时,其放电模式本应占据100维空间,但实际行为中,比如做伸手等动作时,这些活动会坍缩为低维流形结构(lower dimensional manifold structure),沿着该流形的轨迹决定了我们何时以及如何执行伸手动作。
编译补充:举个例子,就像100个人各自乱跳是“群魔乱舞”(高维自由),但一旦跳广场舞,所有人都会跟着领队的动作整齐划一(低维规律模式),这个集体动作的轨迹就决定了舞蹈的整体效果。神经元的“低维流形”也是类似的道理。
保罗·米德尔布鲁克斯:如今我看万物皆流形,甚至两个神经元也能构成流形!这让人不知所措。现在我到了这种地步,“哦,该死,一切都是流形”。“流形”一词似乎失去了原有意义。
艾莉森·普雷斯顿:是的,我也会在系统神经科学家面前使用“流形”这个词。出于同样的原因,他也会说:“哦,流形(又来了)。”
我觉得这个概念正在被很多人使用。虽然“流形”未必是终极真理,但从某种程度上讲,流形是一种思考图式的方式。你可以将图式视为状态空间中的轨迹,而这个空间本身就是一个流形。
保罗·米德尔布鲁克斯:那么流形如何与图式嵌套?它处于更低阶的抽象层次,因为流形是通过测量神经活动定义的,依赖于数据本身。
艾莉森·普雷斯顿:是的,我们正在使用这些工具来研究这些图式表征的几何结构特性。你可以计算刺激之间的距离和方向向量,并通过这些几何特征预测是否存在特定的图式。
在我使用的简单任务示例中——需要明确说明,我不会将其称为图式任务(schematic task)。受试者需学习关联三组刺激物,例如先学习篮球和咖啡杯的关联,再学习咖啡杯到植物的关联。最终测试能否推断“篮球与植物是否存在关联”?此类任务包含37组或更多类似的三元组合,每个都包含其他三幅图像。
早期研究发现,成熟的大脑会直接建立篮球到植物的跨层级关联,且所有三元组的神经表征在脑中几何对齐,也就是说,预测“篮球-植物”关系的向量方向,同样适用于其他三元组(如“书本→灯泡→山峰”)。这种跨任务的一致性即图式的本质,即若能在神经空间中预测路径遍历方式,且该预测适用于任务的其他层面,则构成真实图式。从某种意义上说,这是二级推断(second level inference)。
保罗·米德尔布鲁克斯:换言之,任务表现优异者的神经表征高度对齐,而表现差者则几何结构混乱?
艾莉森·普雷斯顿:是的。那些做不到的人可能在进行初级推断(first level inference),但无法实现表征对齐,因而其表征泛化的能力较弱。大脑可以在不同层次上进行推断,我可以把A和B分开,例如,把篮球和杯子的表征与杯子和植物的表征分开。有些人会把篮球和植物联系起来,但他们不一定会把它与其他所有事物对齐。这反映了不同层次的大脑成熟度。但我们仍不知道是什么导致了这些人的不同。
我无法预测哪些个体能够更高效利用神经几何特性,但已知海马体-前额叶白质连接强度可以预测这类任务的表现,连接越强,神经几何对齐越精准。
保罗·米德尔布鲁克斯:白质就是轴突。
艾莉森·普雷斯顿:是的。白质是海马体与其他脑区(如前额叶)双向通信的物理通路。白质连接更强的人,在这些任务中表现更好。此外,在发育过程中,海马体的体积大小也会影响任务能力。我们对此类个体差异的驱动因素有所察觉,但尚未获得充分证据。
即使在成年被试中,他们的任务表现也存在很大差异。这也是一个悬而未决的问题。比如,神经表征高度对齐一定是优势吗?可能未必,过度对齐可能限制灵活性。
保罗·米德尔布鲁克斯:我们谈谈成熟度(maturity)。你的研究聚焦于海马体、前额叶(尤其是内侧前额叶)及其周边脑区的交互机制。众所周知,或至少在我的认知框架或者认知地图里,前额叶皮层在儿童发育过程中,每天都在形成数以百万计的新连接(突触发生),然后在青少年晚期经历突触修剪,对吗?
艾莉森·普雷斯顿:是在青春期左右,这取决于你的性别和年龄。
保罗·米德尔布鲁克斯:好的。由于前额叶皮层还没有被修剪,还没有被磨砺完善,他们无法抑制(inhibit)不当行为且具有探索性(exploratory),我们因此宽容青少年的过失,对吧?
艾莉森·普雷斯顿:整个大脑都在经历修剪过程,不只是前额叶皮层。
保罗·米德尔布鲁克斯:海马体的修剪机制如何?
艾莉森·普雷斯顿:我之前提到过海马体体积与行为之间存在相关性,它与任务表现相关。有趣的是,海马体中有一块特定子区能够预测你完成这项任务的能力,这可以与修剪过程联系起来。
从某些方面看,青春期的神经变化体现为连接数量的减少,这会在MRI扫描中自动显示为体积减少及相关结构变化。海马体体积减少可预测任务表现,而更优表现可能与修剪相关,修剪过程最终产生低维可能性;当你进行修剪时,实际上正在自动降低神经空间的潜在维度性。
保罗·米德尔布鲁克斯:所以容量空间缩小意味着——
艾莉森·普雷斯顿:是的!更小的海马体(低维空间)反而支持高效推理,它们修剪去除了冗余连接,留下精炼的关系网络。
保罗·米德尔布鲁克斯:回到你举的篮球和植物的例子,以及它们之间的关联。当你谈到图式的时候。我可能——
艾莉森·普雷斯顿:我要明确一点,那不是图式。
保罗·米德尔布鲁克斯:我正想问呢,那是认知地图吗?
艾莉森·普雷斯顿:这正是认知地图(cognitive map)形成的初始阶段。真正的认知地图需要多组关联的几何对齐(如所有三元组的神经表征方向一致)。我们通过关联推理任务(如篮球→杯子→植物)研究这种能力的形成机制,它超越了直接观察,是构建认知地图与图式的基石。
此任务虽简单,却能揭示复杂认知地图的神经机制。当不同三元组的神经表征几何对齐时,即标志认知地图的形成。
保罗·米德尔布鲁克斯:没错,但还不是图式。
艾莉森·普雷斯顿:是的,因为图式必须包含时序性行动计划,也就是“先做什么,后做什么”。这是我对图式的定义,以区别于认知地图。
保罗·米德尔布鲁克斯:明白了。你通过定义图式的时序性内涵间接划定了其外延,图式必须包含时间与行动序列。
艾莉森·普雷斯顿:没错,图式还涉及行为选择,如决策与执行,这是其核心特征。
这有助于将其与更偏向静态的“类别”区分开来(虽然我不确定“静态”是否是最贴切的词)。我之所以强调这一点,是因为我们需要明确这些术语的边界:比如,如何从类别中推导出行为和预测?类别可以告诉我某个刺激属于A类还是B类(如“这是猫还是狗”),但它无法提供行动序列(比如“如何训练猫”),也不包含高度互联的知识网络(比如“猫的习性如何影响训练方法”)。
“概念”比“类别”更抽象。这是一种可能的定义。比如说,当你思考忠诚这样的概念时,你可能会联想到忠诚的行为和忠诚的人,但这和区分狗或者猫的“类别”非常不一样。甚至是区分名词和动词的区别的概念也一样。这与我们讨论的认知地图完全不同,我认为认知地图与图式属于世界模型;它们与更广泛层面的概念和类别存在本质差异。
保罗·米德尔布鲁克斯:它们可以是概念和类别间关系的模型?
艾莉森·普雷斯顿:没错,它们可以是概念与类别关系的整合模型。我倾向于将其视为层级化的复杂性结构,每一层级叠加更复杂的关系与规则。尽管我的定义可能不完美,但明确术语边界对科学研究至关重要。
术语模糊,难以操作:
神经科学领域对心理学研究的批评
保罗·米德尔布鲁克斯:有一点始终让我感到困扰,就是语言作为沟通工具是低维且模糊的,却能承载无限含义。而科学的一大优点是要求对研究对象进行操作定义。你是否认为,神经科学对心理学的批评,如“图式”等术语过于泛化、缺乏实证基础,正源于此?换句话说,若“图式”可以随意解释,它就不再是可科学研究的对象。
艾莉森·普雷斯顿:这一直存在争议。以回忆(recollection)与熟悉感(familiarity)理论为例,这是早期用神经影像学的方法研究心理学概念的核心领域。当你在街上认出某人却想不起细节,如名字、相遇场景,这种“似曾相识”感就是熟悉感;而能提取具体细节,如“上周在咖啡馆见过”,则属于回忆。
保罗·米德尔布鲁克斯:当你看到那个人时,你会说:“哦,六个月前我在某个健身房上芭蕾课的时候见过他。”你可能甚至不记得他的名字,但你有更多关于你在哪里认识他、为什么认识他等背景信息。这就是回忆。
艾莉森·普雷斯顿:为了解析这些现象,学界曾长期认为“海马体负责回忆,其他脑区负责熟悉感”。这种说法既对也不对。
保罗·米德尔布鲁克斯:这甚至都不能说是错的。
艾莉森·普雷斯顿:传统模型并不算错误,但过于笼统。大脑通过突触可塑性,即从单个细胞到大规模网络的动态变化,对经验进行“计算”,最终涌现出回忆的体验。但“回忆”这类低维术语,掩盖了从表观遗传调控、分子信号、细胞活动到系统级协作的复杂过程。这些术语本身并非错误,但它们无法解释“为何我能记得六个月前在健身房见过某人”这一体验背后所涉及的复杂机制。
保罗·米德尔布鲁克斯:也许我们不擅长从系统层面思考问题。至少对我来说,我想尽可能地简化问题,比如说“好吧,海马体负责熟悉感”。因为这样听起来更简单。
艾莉森·普雷斯顿:大脑对所有事情都会采用捷径和启发式方法。
保罗·米德尔布鲁克斯:没错。
艾莉森·普雷斯顿:这就是我之前跟你说的,我们构建启发式方法是为了让事情有80%的正确率,在语言中也一样。
保罗·米德尔布鲁克斯:我在博士论文中研究的是元认知(metacognition),但是在这瞬间我很难向你描述这个术语是什么意思。实际上,你提到的熟悉感和回忆的区分让我想到了它,因为很多关于元认知的研究是基于熟悉感的。
艾莉森·普雷斯顿:并不是说这些术语或原理本身有什么错误,只是当我们将元认知笼统地理解“我们知道自己知道或者不知道某件事”的体验时,该描述对于弄懂这些体验背后的实际机制来说是不够的。
保罗·米德尔布鲁克斯:我发现语言在很多时候都不足以表达我想表达的内容。这并不是因为我是一个高维度思考者,而是因为我觉得语言本身的表达能力是有限的。
艾莉森·普雷斯顿:有时候确实如此。这也是为什么在思考图式时,我们常常觉得语言不够用。这可能正是我尝试用信息理论的思维方式去思考的原因,实际进入大脑的信息是什么,以及大脑基于这些经历存储了什么样的信息?用信息理论的术语来思考,能让我尝试去量化一些东西。这样一来,我对该术语或原理的语言定义可能也会随之调整。这是一个不断权衡的过程,这种自然博弈过程促使我们反思,如果现有图式定义无法解释存储信息的本质,应如何修正定义?
信息论对图式研究的影响
艾莉森·普雷斯顿:我受到了计算机科学和人工智能的影响,在研究中使用了很多这样的工具,在某种程度上,我已经成为了一名信息理论家。
保罗·米德尔布鲁克斯:这是什么意思?
艾莉森·普雷斯顿:当你思考输入大脑的实际信息时,它包含多少比特,呈现何种形态、系统编码这些比特的容量(capacity)如何、以及大脑通过何种采样算法(sampling algorithms)实现高效信息采样,这些问题构成了核心研究维度。我们可以借助互信息理论(mutual information theory)、困惑度(perplexity)与惊奇度(surprise)等模型,量化大脑处理刺激的过程。我认为,我们既要充分理解刺激本身,也要同等重视对刺激的处理方式,而这与人类注意力的机制密不可分。
保罗·米德尔布鲁克斯:从信息理论的角度出发,鉴于大脑的有限容量,所以必须关注环境中最重要的特征。重要性的判定取决于目标;具体而言,它由任务性质与目标设定共同决定。我们刚刚在高层次上谈到了不同年龄段的不同目标。青少年的目标是探索环境,成年人的目标是尽可能利用他们所知道的东西。这实际上对不同年龄段记忆表征的维度也有有趣的启示。
艾莉森·普雷斯顿:这一假说尚待验证,但极具探索价值。我们推测,在学习新经验时,成人的神经表征维度可能呈现U型曲线,初期维度升高,随后通过图式整合降低维度;相比之下,青少年的主动抑制旧知识从而使其维持高维表征。而图式天然涉及信息压缩,从而提高行为效率。这就是记忆有时候模糊或出错的地方,源于对目标无关维度的主动压缩。当你后来需要使用基础知识时,你可能会错误地填补那些被压缩的维度。
保罗·米德尔布鲁克斯:你必须从那个低维图式表征的确切空间中进行采样。
艾莉森·普雷斯顿:正是如此!信息理论的价值在于,它为我们提供了量化知识结构动态变化的工具,无论是通过个体内部还是跨发展阶段的量化分析,通过分析神经表征的维度性,我们能间接测量人类记忆的图式化程度及其演化轨迹。
保罗·米德尔布鲁克斯:我想到了信息论在神经科学领域存在的一个争议,神经科学近年过度追捧信息量化研究,将一切认知过程简化为信息流的传递。比如朱利奥·托诺尼(Giulio Tononi)提出的整合信息理论在意识研究领域非常热门,他用互信息和因果传递解释意识。
即便是创立了香农信息论的香农(Claude Shannon)本人,也曾警告不要将其直接应用于生物系统。核心之一是,传统信息论要求存在发送方与接收方,且接收方必须预知所有可能的信号集合。但你之前提到,图式本质上是目标驱动的行为框架。于是我设想,如果将目标视为“可能的消息集合”,让目标本身定义接收信号的范畴(比如只有与目标相关的信息被接收),或许能构建一种新的信息度量方式。你认为这一思路可行吗?
艾莉森·普雷斯顿:我认同这一思路,因为目标在某种意义上设定了注意力过滤器(attention filter),进而决定哪些潜在信息能被接收。目前我们尚未全面应用这一理论,但实验室已启动新方向,与德州大学奥斯汀分校的亚历克斯(Alex)合作,开展更贴近真实世界刺激与自然叙事的研究。亚历克斯的研究专长是语义知识编码,他大量运用大语言模型(LLMs)解析这一过程。我们的合作源于一个共同问题——“人们真正的记忆内容”,而他的工作聚焦于记忆与知识的神经机制。
我们的实验设计是让被试聆听故事后延迟回忆故事的内容,进而分析刺激信息与回忆的时间节点之间的关系,以及回忆细节的分辨率。研究大量应用信息论工具,尤其是基于LLMs的逐词预测能力,在此框架下,利用LLMs模拟“信息发送者”与“接收者”(communicator-receiver)的交互。由于我们使用的大型语言模型经过了大量的训练,刺激信息非常丰富。
保罗·米德尔布鲁克斯:没错,有数百万种可能的消息。
艾莉森·普雷斯顿:正是如此。我们正用这种方法刻画记忆的关键时间节点及其信息采样模式。对于更简化的实验任务而言,目标至关重要,它决定了被试的注意力焦点,也屏蔽了无关信息。作为心理学家,我们必须警惕这一点,无论是指导人类被试的实验指令,还是训练非人灵长类或啮齿类的任务范式,本质上都在预设他们的“信息过滤器”,从而系统性地偏向某些知识获取方式。
这真的很有趣。回到图式相关的研究,有人尝试教给孩子们将不同经历联系起来的策略。即便你明确指导他们这么做,儿童的实际应用倾向仍较低。这说明他们在完成这件事上存在一些根本性的局限,但你可以给他们设定一个预期目标,引导其认知发展路径。
该研究由我实验室的研究助理妮可·瓦尔加(Nicole Varga)主导,她和帕特里夏·鲍尔(Patricia Bauer)一起合作,采用了和我们篮球与植物那个例子类似但更贴近现实的范式。你可以学习一个事实,这属于语义知识的范畴。例如:先学习“所有袋鼠的幼崽都叫Joey”,再被告知蓝飞鼠是袋鼠的一种"",随后推理问题“蓝飞鼠的幼崽叫什么?”答案自然是Joey。
成年人在这方面的表现比六岁孩子要好。即便你告诉六岁孩子要把这些信息在记忆中联系起来,他们的表现还是不如成年人。
不过,通过目标设定可引导个体信息处理路径。成人的认知系统存在差异,不同个体对“蓝飞鼠与幼崽乔伊”的关联强度差异显著。通过设定目标,我们可以引导成人调整这种关联。然而,儿童的认知系统存在固有限制,难以灵活执行此类任务。从信息论的角度来看,我认为目标为接收者预期接收的消息设定了一个重要的筛选条件。
保罗·米德尔布鲁克斯:你的意思是,现在在哪儿都能看到“比特”了吗?
艾莉森·普雷斯顿:不,我将信息论视为一种工具,它和所有工具一样存在局限。关键在于如何针对具体任务设计实验,明确哪些变量需要量化,并评估信息论是否适用。
保罗·米德尔布鲁克斯:如果你清楚自己要什么,那么它就有助于你设计出更好的任务。
艾莉森·普雷斯顿:没错。这就是我们从一开始就引入信息论来研究相关问题的原因。
人工智能启示:
图式理论对LLM的挑战
保罗·米德尔布鲁克斯:我们之前略有提及,但我想听听你对现代人工智能(如大语言模型)的看法。结合你在图式发展与时间维度上的研究,当审视大语言模型或广义的现代AI模型时,您认为它们是否显得幼稚可笑?当然它们令人惊叹,但你认为哪些神经科学原则应被用于改进模型?例如,模型是否需要像人脑一样阶段性抑制某些信息?
艾莉森·普雷斯顿:我认为AI无需完全模仿人类,它们的核心目标并非如此。尽管设计类人模型或许是可敬的目标,但这未必是唯一路径。
保罗·米德尔布鲁克斯:但不管怎样,这种情况已经在发生。
艾莉森·普雷斯顿:确实如此。
保罗·米德尔布鲁克斯:模仿人类并非AI开发的必选项。
艾莉森·普雷斯顿:我将从两个方向展开:一是如何用AI解决神经科学问题,如解析脑成像数据,二是神经科学如何启发AI,尽管对于后者我的思考尚未体系化。
当前的大语言模型与人类存在本质差异,它们的训练数据(如全网文本)与人类经验(多模态交互)截然不同。尽管它们过去在推理任务(如逻辑推断)糟糕,但近年来进步神速。两三年前,它们在推理和演绎等方面还比较薄弱。而这正是人工智能领域目前重点攻克的方向。
保罗·米德尔布鲁克斯:AI领域常有这样的剧情:宣称“遇到技术瓶颈“,随后通过扩大模型规模直接碾压瓶颈。
艾莉森·普雷斯顿:确实如此。但模型的进步机制仍不透明,这种“黑箱跃迁”令人兴奋,也暗藏风险。是的。这种震撼令人不安。
保罗·米德尔布鲁克斯:是的。这种震撼令人不安。
艾莉森·普雷斯顿:是的,我们利用大语言模型(如GPT)作为预测表征工具。当模型在数十亿文本数据上训练后,它能高精度预测叙事中的下一个词,这源于其对人类语言整体特征的统计建模。这对认知实验设计极具价值,例如,向受试者呈现自然叙事时,模型可量化刺激细节的颗粒度,进而分析受试者的回忆表现差异,是逐字复述(高细节还原),还是模糊概括(低细节整合)。”
举例来说,假设你听到一个故事:角色决定狂吃垃圾食品,他坐在电视前,吃了一品脱冰激凌、一碗爆米花和一袋薯片。若你的记忆是以高维表征储存,其细节较为精确,你会原样复述这三种垃圾食品。
但多数人会用图式来回忆。有些人在编码这个故事时,心里可能会想着:“哦,他们暴吃了一堆垃圾食品。”回忆起来可能就只说:“哦,他们暴吃了一堆垃圾食品。”仅此而已。而另一些人可能会说:“他们坐在电视机前,吃了一品脱冰淇淋,一碗爆米花,还有一袋薯片。”这就是一种高维度的表征。而还有人,这时候图式就开始变得有趣了,他们会说:“哦,他们吃了一堆垃圾食品。有好多士力架,还吃了披萨。”他们给出了不同种类的垃圾食品。
保罗·米德尔布鲁克斯:等等,这是说模型还是?
艾莉森·普雷斯顿:人类会这样做,他们会根据图式补全细节。而AI模型需要调整参数才能实现,你可以设置模型输出具体细节。
保罗·米德尔布鲁克斯:为什么人们会有不同的表现,既会有简单回忆,也会有详细描述呢?
艾莉森·普雷斯顿:个体差异本身便是研究重点,关键机制不仅存在于回忆阶段,记忆编码过程的运作方式同样至关重要。例如,当听到“角色吃垃圾食品”时,某些人会主动忽略具体食物种类,因为这与故事主旨无关。但当你要求他们详细回忆时,他们反而会调用其他“垃圾食品”图式填充细节,即使原文未提及。
保罗·米德尔布鲁克斯:图式会作为提取细节的入口。
艾莉森·普雷斯顿:没错。这就是虚假记忆产生的原因。就像是我运用自己的图式重现了一些当时没有以足够高维度进行编码的内容。现在你让我回忆,我就可能会出现虚假记忆。
这种情况在概念和词汇方面也会出现。
大型语言模型的独特价值所在,它能从信息论视角预测人类在何时会选择高维编码或低维编码。例如,模型可量化分析某个刺激的“记忆潜力”,又能量化其与人类记忆的神经关联强度。
如果我们对此有足够深入的了解,就可以利用这些模型以特定的方式构建具有特定属性的叙事,然后让人类对这些叙事进行评估,问他们:“这些故事中,哪一个最令人难忘?”更进一步,通过模型生成能精确诱导特定知识状态的刺激材料,实现对认知过程的可控操纵。
保罗·米德尔布鲁克斯:哦,操控和支配。
艾莉森·普雷斯顿:没错。你可以用这些模型以有趣的方式来测试哪些内容对人们来说真正具有记忆点。
保罗·米德尔布鲁克斯:关键在于,通过特定叙事结构,你实际上在“编码”受众的图式形成路径。
艾莉森·普雷斯顿:没错。
保罗·米德尔布鲁克斯:这其实就是作家的本职工作。
艾莉森·普雷斯顿:确实,人类数千年来一直在通过叙事操控记忆与认知。
弄清楚什么样的人算得上优秀的讲故事者,是个很有趣的问题。这就涉及到创造力的话题。尽管叙事学已有大量研究,但过去缺乏量化工具。如今神经科学如何反哺AI?
保罗·米德尔布鲁克斯:你是否认为AI领域应主动吸收神经科学的成果?例如,将图式理论融入模型设计?
艾莉森·普雷斯顿:这正是我们当前研究的前沿方向,通过共享工具,如信息论框架与大语言模型,我们实现了跨学科的范式融合。当采用信息论的共同语言时,认知机制与计算模型的深层关联自然显现。许多研究已开始引用我们的工作,例如设计具备推理能力的神经网络。而AI研究者也正将大语言模型应用于我们探索数十年的研究问题,比如记忆预测。这种双向渗透体现着学科发展的必然,AI研究者试图用模型破解我们长期探索的认知难题,而神经科学的理论框架正在重塑AI架构的设计哲学。尽管当前LLMs仅聚焦语言,但其底层机制,如注意力权重分配,与人类记忆的图式编码存在深层关联。
保罗·米德尔布鲁克斯:有人可能会不同意这种观点。
艾莉森·普雷斯顿:具体来说,当前AI模型(如LLMs)缺乏多模态整合能力。人类大脑能将视觉、听觉、情感等信息无缝整合为统一表征,而AI模型仍处于初级阶段,它们要么处理文本(如GPT-4),要么处理图像(如DALL·E),但无法像人类一样融合多模态输入构建图式,AI模型还在继续发展构建中。以观影过程为例,人类会同步整合叙事内容、情感线索、视觉元素、人物关系与物体识别,这正是LLMs与当前多模态模型的根本缺陷所在。
保罗·米德尔布鲁克斯:就像之前讨论的“垃圾食品”图式需要多模态整合一样。
艾莉森·普雷斯顿:没错。该问题具有多维复杂性。大型语言模型无法捕捉这些事物中的视觉和空间信息,正如很多时候你看电影时,并没有台词,只有动作。有时候屏幕上甚至都没有人物。人类大脑能够自然地完成多模态整合,并利用多源信息的预测和意外(如突然的寂静预示危险)构建意义,而人工智能模型目前还做不到这一点。
保罗·米德尔布鲁克斯:你会如何构建一个人工智能模型呢?
艾莉森·普雷斯顿:我不知道。我不是搞人工智能的。不过确实有人在研究这个。他们正在努力构建这些大型的多模态模型,以便根据不同的数据源进行跨模态预测。这是人工智能领域的一个重要研究方向。也许人工智能可以向人类大脑学习,了解人类大脑是如何整合这些信息的。我期待这类模型的诞生,因其能帮助我们实证研究真实情境下的情景记忆编码过程。非常期待看到这方面的进展。
保罗·米德尔布鲁克斯:简而言之,你支持用深度神经网络作为脑活动的代理模型,进而反推真实大脑的运作机制。如果能用模型预测脑活动,你认为这是有价值的。
艾莉森·普雷斯顿:它们并非完全代理,而是量化工具。模型允许我们参数化某些变量,如注意力权重、记忆熵,并观察大脑是否遵循这些变量。尽管这些参数未必精确对应神经机制,但就像数学心理学用简化模型量化行为一样,它们提供了可操作的测量框架。
当前模型并非试图复现人脑,而是作为计算工具。例如,模型如何通过特定计算预测行为?我们可进一步验证这些计算是否与脑活动关联。这才是它们的核心价值。
保罗·米德尔布鲁克斯:数学心理学模型的精妙之处在于其极简性,这些微型模型能用少数直观参数解释复杂行为。只要接受模型的前提假设,如人类决策依赖预期效用最大化,且其预测符合实际行为数据,就能构建一个逻辑自洽的理论框架,如用强化学习解释购物选择。然而,大模型的庞大规模与复杂性,却让这种可解释性被彻底摒弃,沦为无法追溯因果的黑箱。
艾莉森·普雷斯顿:确实如此。
保罗·米德尔布鲁克斯:如果只需针对特定问题(如预测单词序列)而无需全局解释模型行为,或许这种限制是可接受的,但……
艾莉森·普雷斯顿:但研究存在边界。我们尝试通过调整注意力层(attention layer),探索模型如何编码信息。例如,在叙事任务中,某些注意力头可能专门捕捉时间顺序(如“先发生A,后发生B”),而其他头处理情感关键词(如“悲伤”“兴奋”)。我们可通过遮蔽或增强特定头来验证假设,但这不意味着我能解释模型第9层与第12层的功能差异,这如同破解黑箱(black box)中的未知密码。理解这些模型的本质、目标及其与大脑的映射关系存在根本性障碍,毕竟人工智能与人类神经系统遵循截然不同的演化逻辑。
保罗·米德尔布鲁克斯:完全认同。但耐人寻味的是,许多研究者坚信AI模型即大脑的数字化身。更荒诞的是,当前模型的神经元概念(如McCulloch-Pitts神经元)基于1943年的理论,与真实神经元的生物复杂性相比,简直像用蒸汽机图纸造火箭。
艾莉森·普雷斯顿:这些模型需要大量的数据进行训练,与大脑有着本质的区别。人类大脑的学习过程可不需要那么多数据。
从实验室到真实场景
——对养育者的启示
保罗·米德尔布鲁克斯:我想从你的子女谈起,当然也包括你实验室的学生,你的研究,尤其是青少年神经发育,是否影响了你对多样性行为的接纳方式?”
艾莉森·普雷斯顿:我先说说我的孩子吧。毕竟作为一名研究青少年发展的神经科学家,有时候这方面的研究确实对我有帮助。
保罗·米德尔布鲁克斯:真的吗?我的研究领域与家庭生活仿佛平行世界,我几乎从未将学术知识应用到育儿中。
艾莉森·普雷斯顿:我确实会这样。比如当我的青少年孩子做出冲动行为时,我会想:“这是因为他们的前额叶皮层(注:负责决策与冲动控制的脑区)尚未发育成熟。”这让我能以更包容的态度看待他们的行为——毕竟他们的大脑正在按自然规律发展。
保罗·米德尔布鲁克斯:你真这么跟他们说了?“你大脑还没发育好呢。”
艾莉森·普雷斯顿:当他们心情不错时,我会用开玩笑的口吻这么说。但更多时候,我内心会默念:“别被激怒,他们的大脑本就该如此运作。”这种科学视角让我更平和地应对青春期行为。
保罗·米德尔布鲁克斯:不过,孩子们会认同这种解释吗?
艾莉森·普雷斯顿:有时候会吧。
保罗·米德尔布鲁克斯:你之前私下提到,很惊讶于孩子们在他们成长过程没有讨厌过你。
艾莉森·普雷斯顿:是的,他们喜欢和我相处。
保罗·米德尔布鲁克斯:这已是为人父母最大的慰藉。
艾莉森·普雷斯顿:不,我认为这是育儿的一大成功。我接纳他们作为独立个体的存在,并理解他们的行为反应并非针对我或我的教养方式,而是源于他们内在的神经发育进程,这种视角至关重要。若非如此,我不知该如何应对。
保罗·米德尔布鲁克斯:确实有帮助。
艾莉森·普雷斯顿:还有一件事,我女儿上高中的时候被诊断出患有多动症。我们让她做了基因检测,以便了解哪种药物对她最有效。我们发现她大脑中的D2受体过于活跃,会将多巴胺从突触间隙中清除得太快。这会带来一些影响。另外,我拿出大学时的幻灯片向她解释她大脑里发生的情况。这让她更能接收自己的多动症,因为她明白了背后的生物学原理,也让她意识到自己并没有什么问题,只是大脑发生了一些改变。
保罗·米德尔布鲁克斯:是的,她不会再觉得这个问题有多独特了。
艾莉森·普雷斯顿:某种意义上,她的大脑以独特方式变得更高效了,这是干预的结果。作为父母,这种经历让我受益匪浅。我的儿子今年15岁,他在3岁时被诊断出脑癌。身为神经科学家,这一身份无疑帮助我应对了那些艰难时刻。我常利用神经科学知识为其他父母提供支持,虽不总是奏效,但至少提供了新的视角。至于指导他人,我不确定我是否像在实验室中一样系统化,更多时候,我是用同理心去指导他们。
保罗·米德尔布鲁克斯:关于实验室里的学生们,你在招聘的时候会扫描他们的大脑,看看他们大脑的分化和整合能力如何,对吗?
艾莉森·普雷斯顿:没有,我没这么做。而且我也不知道自己能不能这么做。我不知道要做到什么程度,才能看着一个人的大脑扫描结果说:“哦,你就是我想要的那种能够成长为创造性思考者的人。”
保罗·米德尔布鲁克斯:也许有一天可以吧。
艾莉森·普雷斯顿:也许吧。
保罗·米德尔布鲁克斯:好的,艾莉森,谢谢你抽出时间来和我聊这些。我一开始就说过,我的目标是更好地理解图式。你一开始就提到了一些关键内容,比如顺序性、时间序列的重要性,以及它们与目标的关联,这对我很有帮助。我一直想弄清楚图式和认知地图之间的区别,现在这个问题解决了。我现在对图式的理解清晰多了。
它仍然是一种心理构念。
艾莉森·普雷斯顿:没错,它是对实际发生过程的一种低维度描述。"

作者:盛煌娱乐




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 盛煌娱乐 版权所有