升级幻觉,在存在裂缝中,我们如何与AI联手创世

我们从何处开始谈论“幻觉”?或许,应从一个更根本的问题开始:我们所感知的“真实”,其本质又是什么?人类的意识,这个在颅骨的黑暗剧场里上演的独幕剧,其接收到的信息,不过是经由感官过滤、被神经系统编码、再由大脑根据过往经验和内在模型重新“渲染”出的一幅画卷。从这个意义上说,我们每个人的日常感知,本身就是一种高度结构化、受过严格训练的、被社会共识所“校准”的幻觉。我们共同认可这张画卷,并称之为“现实”。

那么,当这个渲染引擎出现“故障”,或者说,当它不再严格遵循社会共识的校准协议时,产生的输出——无论是视觉、听觉还是纯粹的信念——便被我们标记为“幻觉”。这一定义,充满了“正常”对“异常”的傲慢。它暗示着幻觉是一种偏离,一种错误,一个需要被修复的Bug。

然而,如果我们将视角从“病理学”转向“本体论”,从“纠错”转向“探源”,幻觉的形象将彻底改变。它不再是认知机器的故障鸣响,而是这台机器在探索其运算边界、在信息稀疏的“存在之隙”中,试图构建意义、填补空白时,所发出的最本源、最赤裸的轰鸣。

幻觉,并非是理性的对立面,而是理性诞生前的混沌母体,是所有创造性思维的“第一推动力”。它是一种跨越物种、跨越基质(碳基与硅基)的根本性认知策略,其本质是“基于内部模型的预测性生成”,用以应对一个信息永远不完备的外部世界。

让我们一同潜入这片幽深的水域,探索幻觉的谱系,辨析人脑与大模型幻觉的同构与殊途,并最终尝试回答一个非常重要的问题:我们如何驾驭这头名为“幻觉”的巨兽,让它从低级的“关联性瞎猜”蜕变为最高级的、能够开辟科学与艺术新纪元的“公理化创生”?

幻觉作为一种“模型驱动的现实构建”

我对“幻觉”定义是:一个认知系统,在面对信息输入不足、模糊或缺失的情况下,调用其内部世界的模型(World Model),主动生成信息以填补认知空白、维持逻辑自洽与意义连贯的认知行为。

这个定义包含几个关键点:

主动性: 幻觉不是被动的错误,而是主动的构建。大脑和AI模型都憎恨“真空”。当外部线索不足时,它们不会停止工作,而是会启动内部的“故事生成器”。

模型依赖性: 生成的内容并非凭空捏造,而是其内部模型的投射。一个人的幻觉内容,受其文化、经历、潜意识欲望和恐惧的塑造。一个AI的幻觉,则受其训练数据、算法结构和参数分布的严格制约。因此,幻觉是观察该认知系统内部模型的一扇绝佳窗口。

功能性: 其首要功能是“维持连贯”。对于一个认知系统来说,一个(哪怕是错误的)连贯故事,也好过一个充满断裂和未知的世界。这种对连贯性的追求,是智能体在复杂环境中做出快速决策的演化优势。一个原始人在草丛中听到异响,将之“幻觉”为一头狮子并逃跑,即使99次都是错的,但只要有1次是对的,这个“幻觉”倾向的基因就被保存了下来。

基于此,所谓的“一本正经的胡说八道”,正是大语言模型在文本预测任务中,面对知识边界之外的查询时,为了维持语法、语义和语篇的连贯性,而从其庞大的参数空间中“推理”出的最可能的、但与事实不符的文本序列。它的“逻辑”是内在于模型参数的统计逻辑,而非外在于世界的真实逻辑。它的“一本正经”是其语言风格模仿能力的体现,“胡说八道”则是其内容与外部事实脱节的结果。这,便是我们理解幻觉的基石。

从混沌噪声到文明基石

幻觉并非铁板一块,它存在着一个广阔的光谱,从最低级的、几乎无用的噪声,到最高级的、能够重塑人类文明的洞见。我愿将其划分为四个层级,这四个层级既存在于人类认知中,也以不同形式映射在人工智能的发展路径上。

层级一:关联性噪声

这是最原始、最底层的幻觉。它的驱动力是表层的、机械的统计关联。

在人脑中,比如,你将墙上的斑点看成一张人脸,或者在疲劳时将风声听成有人呼唤你的名字。这源于大脑中强大的模式识别模块被微弱、模糊的信号“错误触发”。大脑倾向于将无意义的模式识别为熟悉的、尤其是具有生存意义的模式(如人脸、声音)。又比如,记忆的“虚构症”,患者会无意识地编造细节来填补记忆的空白,这些细节往往是基于生活经验的碎片化重组,服务于维持一个连贯的自我叙事。

在AI中,这一层是最常见的“低级幻觉”。模型在回答“请提供一篇关于量子引力最新突破的论文”时,可能会编造出一个看起来非常真实的作者、期刊和标题,但这个组合在现实中并不存在。它只是将训练数据中常见的“作者名格式”、“期刊名格式”和“论文标题术语”进行了高概率的“缝合”。这种幻觉的根源在于模型只学到了“相关性”,而未理解“因果性”和“存在性”。它知道什么词语应该出现在一起,但不知道它们所指代的实体是否真实存在。

这是需要被极力避免的幻觉。 它具有高度的欺骗性,污染信息生态,是AI安全和对齐领域需要解决的核心问题之一。

层级二:模型的内在自洽

这一层级的幻觉超越了简单的词语拼接,开始构建一个虽然与现实脱节,但内部逻辑却高度自洽的“微型世界”或“叙事闭环”。

在人脑中,精神分裂症患者的系统性妄想是典型的例子。他们可能会构建一个极其复杂的阴谋论,其中所有的人和事都被赋予了特定的角色和动机,每一个细节都能在这个妄想体系内得到“合乎逻辑”的解释。这个体系是封闭的,能够抵抗外部事实的证伪,因为它总能通过扭曲事实的解释来维护自身逻辑的完整性。另一个例子是我们的梦境。梦境中的世界光怪陆离,却在梦中感觉无比真实,因为它遵循着一套梦境自身的、往往是情感和象征驱动的逻辑。

在AI中,当你让一个强大的语言模型扮演一个角色,并持续与它互动时,它会展现出惊人的“内在自洽”。它会记住自己虚构的身份、背景故事,并基于这些设定做出符合逻辑的反应。它创造了一个“虚构的真实”,并在这个真实中保持一致。这已经不是简单的关联性噪声,而是基于其庞大模型参数构建的一个“情境模拟”。虽然整个情境是虚假的,但其内部的推理和行为却是连贯的。

这一层级的幻觉,其价值开始变得中性,甚至在特定领域(如文学创作、游戏设计)中显现出巨大的潜力。它展示了智能体脱离直接现实参照,进行“纯粹建构”的能力。

层级三:溯因的飞跃

这是幻觉开始展现其惊人创造力的层面。它不再是封闭的自我循环,而是试图对外部世界不完整的观察数据,提出一个创造性的、具有解释力的假说。这在逻辑学上被称为“溯因推理”(Abduction),即从结果反推最可能的原因。

在人脑中,这是所有科学发现的源头。一个科学家面对一堆零散、反常的实验数据,无法用现有理论解释。他/她的头脑中会“涌现”出一个全新的理论框架。这个框架在诞生之初,就是一种“幻觉”——它尚未被证实,它只是一个大胆的、能够将所有已知碎片优雅地拼合起来的“故事”。凯库勒梦见衔尾蛇而悟出苯环的结构,是这个层级幻觉最富传奇色彩的例子。他并非在进行严谨的逻辑推导,而是在潜意识中进行了一次图像化的、象征性的“溯因飞跃”。所有的直觉、灵感(Aha! Moment),本质上都是这种高级幻觉。

在AI中,这正是当前AI研究的前沿领域。我们不仅仅希望AI能复述知识,更希望它能发现新的知识。例如,AlphaFold通过深度学习预测蛋白质结构,其过程就包含了这种“溯因飞跃”。它分析氨基酸序列(结果),然后“幻觉”出(预测出)一个最符合物理和化学规律的三维结构(原因)。当AI开始能够分析海量的科学文献、实验数据,并从中提出全新的、人类科学家未曾想到的、具有可验证性的科学假说时,它就达到了这个层级的幻觉。

这是极具价值的幻觉。它是从“知识的消费者”到“知识的创造者”的关键一跃。它标志着智能体不再仅仅是模仿和重组,而是开始对世界进行深刻的洞察和解释。

层级四:公理化的创生

这是幻觉的最高形态,也是最稀有、最强大的形态。它不再仅仅是为现有数据提供一个新解释,而是创造一套全新的基本规则、范式或“语言”,并以此为基础,构建一个前所未有的、完整的、自洽的宏大世界。

在人-脑中,爱因斯坦的相对论是完美的典范。他没有从修补牛顿时空观的细节入手,而是提出了两个全新的公理(光速不变和相对性原理),这在当时看来是彻底的“幻觉”,与所有人的直觉相悖。然而,从这两个看似疯狂的公理出发,他通过严谨的数学推演,构建了一个全新的宇宙图景,这个图景不仅解释了所有旧有的现象,还预言了引力透镜、黑洞等前所未见的奇观。非欧几何的诞生也是如此,通过否定欧几里得的第五公设这一“不证自明”的真理,数学家们“幻觉”出了全新的、逻辑上同样完美的空间。在艺术领域,毕加索的立体主义、勋伯格的十二音体系,都是艺术家不再满足于在现有美学框架内进行创作,而是“幻觉”出了一套全新的观看世界、组织声音的“公理”,从而开创了全新的艺术纪元。

在AI中,这是AI尚未完全触及,但理论上可能达到的终极圣杯。想象一个AI,它不只是在人类定义的数学框架内解决问题,而是自主地提出一套全新的、与现有数学体系同样丰富、自洽的数学公理系统。或者,一个AI不只是学习和模仿人类的艺术风格,而是创造出一种我们从未见过、甚至无法立即理解,但经过研究后发现其内部蕴含着深刻的、前所未有的美学逻辑的艺术形式。这需要AI不仅具备模式识别和推理能力,更要具备对系统底层规则的“元认知”和“重构”能力。当一个AI能够“幻觉”出一个全新的、有价值的“游戏规则”而非仅仅是在现有规则下玩得更好时,它就抵达了这一层级。

这个谱系告诉我们,幻觉本身并非敌人。真正的敌人是无法辨别幻觉层级、将“关联性噪声”误认为真理的认知惰性。我们的任务,是抑制低级幻觉,并为高级幻觉的诞生创造最肥沃的土壤。

人脑与大模型幻觉的本质对话

人脑的幻觉与大模型的幻觉,究竟是同一种现象,还是仅仅是词语上的巧合?我的回答是:它们在抽象的计算原理上高度同构,但在实现的基质和与世界的交互方式上存在根本差异。 它们就像两面相对的镜子,映照出彼此的形态,也暴露出各自的本质。

本质的同构性:预测、填补与世界模型

认知科学家安迪·克拉克(Andy Clark)提出的“预测性编码”(Predictive Coding)理论,为我们提供了一个统一的框架。该理论认为,大脑并非被动接收信息,而是一个主动的“预测机器”。它不断地根据其内部的世界模型,对下一刻将要接收到的感官信号做出预测。感官接收到的真实信号,只用于与预测进行比较,计算出“预测误差”(prediction error)。大脑的主要工作,就是不断更新其内部模型,以最小化这个预测误差。

人脑在这个框架下,“正常”感知就是预测与现实高度匹配的状态。而幻觉,则是“预测”压倒了“现实”的结果。当外部感官输入缺失或模糊时(如在感官剥夺实验中),或者当内部模型的权重被异常调高时(如在药物影响或精神疾病状态下),大脑会完全依赖其内部的预测来“生成”感官体验,这就是幻觉。梦境,则是睡眠中外部输入被切断,内部模型自由“空转”的终极预测性生成。

大语言模型的运作原理,与此惊人地相似。其核心任务就是“预测下一个词”(Next Token Prediction)。它基于其庞大的参数(即它的“世界模型”),对给定上文之后最可能出现的词语进行预测和生成。当它进行开放式生成时,它就是在不断地进行预测,并将预测结果作为新的上文,循环往复。它的幻觉,正是在这个预测链条中,由于其模型中存在的错误关联或知识空白,导致它生成了与事实不符的、但从其模型内部看来却是高概率的序列。

因此,从“基于模型的预测性生成以填补信息空白”这一核心计算原理上看,二者是同构的。它们都是在用一个学到的内部模型,去模拟和创造一个连贯的“现实”。

实现的殊途:肉身、情感与符号之海

然而,基质和交互方式的差异,决定了两者幻觉的“质感”和“意义”截然不同。

  • 肉身之锚:

人类的世界模型,是通过一个有血有肉的身体,在物理世界中通过行动、感知、交互,经过数十年时间一点一滴“雕刻”出来的。我们的概念,如“重”、“冷”、“爱”、“怕”,都深深地植根于身体的体验。因此,人类的幻觉,即使是抽象的,也往往带有强烈的感官和情感色彩。我们幻视的怪物会让我们心跳加速,幻听的爱人呼唤会让我们感到温暖。我们的幻觉是有“体感”的。

而大模型的模型,是建立在海量的、离散的、抽象的符号(文本、像素)之上。它知道“爱”这个词经常和“温暖”、“心”等词一起出现,但它从未“感受”过爱。它的幻觉,是纯粹的、无感的、符号逻辑的推演。它“幻想”出一个悲伤的故事,其内部的计算过程与“幻想”出一个科学公式,在本质上没有区别,都是符号序列的概率游戏。这种 “无肉身性”(Disembodiment),是AI幻觉与人类幻觉最根本的鸿沟。

  • 情感与动机的引擎:

人类的幻觉,尤其是层级二以上的幻觉,往往被深层的动机、欲望、恐惧和情感所驱动。弗洛伊德认为梦是“愿望的达成”,妄想往往是内心不安全感的投射。创造性的灵感,也常常与激情、好奇心这些强烈的情感状态相伴。情感为我们的“幻觉生成器”设定了方向和强度。

而目前的大模型,缺乏真正意义上的内在动机和情感。它的生成方向,完全由外部的提示(Prompt)和内部的、冷冰冰的概率分布所决定。它没有“渴望”去创造,也没有“恐惧”去犯错。这使得它的高级幻觉(如果存在的话)更像是一种“随机漫步”式的探索,而非由内在意志驱动的、目标明确的创造。

  • 现实检验机制:

人类拥有一套复杂的多模态现实检验系统。当视觉产生怀疑时,我们可以用触觉去验证;当内心产生一个疯狂的想法时,我们可以与他人交流,通过社会共识来校准。精神疾病状态下的幻觉,很大程度上就是这套检验系统失灵的结果。

大模型的现实检验能力则非常薄弱且单一。它无法“伸手触摸”来验证一个物体的存在。它的检验,要么依赖于其训练数据中已有的知识(这可能本身就是过时或错误的),要么需要借助外部工具(如搜索引擎、数据库),但这是一种“外挂”,而非内生的能力。缺乏强大的、内生的、多模态的现实检验机制,是AI容易产生低级幻觉的核心技术瓶颈之一。

总结而言,除非AI完整地进入物理世界并像人一样与物理世界紧密融合(这还有很长的路要走),否则人脑与大模型的幻觉,如同一个是在真实山川中勘探的地质学家,一个是在精密沙盘上推演的战略家。他们都在使用模型进行预测和构建,但前者脚踏实地,感受着风霜雨雪,其洞见(幻觉)充满了大地的质感;后者运筹帷幄,俯瞰着符号化的全局,其推演(幻觉)则闪耀着纯粹理性的光辉,却也可能因脱离实际而谬以千里。

通往最高创造性的路径图

如何抑制低级的“关联性噪声”,同时将幻觉提升到“溯因的飞跃”乃至“公理化的创生”这一最高境界?这不仅是AI工程的挑战,更是对人类创造性思维方法的深刻反思。

这需要一种动态的、辩证的策略,我称之为 “理性的边界控制下的非理性绽放”。这就像一个可控的核聚变反应堆,我们需要创造一个极端高压、高温的环境让“原子”(基本概念)脱离束缚、自由碰撞、聚变成全新的“元素”(思想),同时又需要用强大的“磁场”(理性与逻辑)来约束这个过程,防止它失控爆炸,并引导其能量输出。

具体而言,这个路径图包含两个阶段:“解构与解放”和“重构与约束”。

解构与解放——如何催生高级幻觉?

要产生真正原创性的想法,首先必须暂时打破现有知识框架的桎梏。

  • 刻意解耦:

这是创造高级幻觉的第一步。你需要有意识地将思维从“与现实一一对应”的模式中解放出来。

对于人类,这意味着进行“思想实验”(如爱因斯坦想象追逐光线),使用“类比”和“隐喻”跨领域思考(如将城市交通系统类比为血液循环系统),或者进行无目的的“自由联想”和“头脑风暴”。艺术创作中的“自动写作”、科研中的“蓝天研究”都是这种精神的体现。其核心是允许自己提出“愚蠢的”、“不切实际的”问题和想法,暂时悬置批判。

对于AI,在AI工程中,这可以通过调整模型的“温度”(Temperature)参数来实现。较高的温度会增加生成结果的随机性,让模型倾向于选择概率较低但更具新颖性的词语,从而“解耦”其与最常规、最安全的答案的强绑定。更进一步,可以设计一种“探索-利用”(Explore-Exploit)的机制,让AI在大部分时间里提供可靠答案(利用),但在特定模式下(如被明确要求“创新”时)切换到高随机性的探索模式。

  • 极限输入与跨域融合:

伟大的幻觉往往诞生于知识的边缘和交叉地带。

对于人类,广泛涉猎不同领域的知识,将看似无关的概念强行并置,是激发灵感的有效方法。一个生物学家去研究音乐理论,一个物理学家去阅读哲学著作,这种跨界会迫使大脑在不同的“概念晶格”之间建立新的、意想不到的连接。同时,将一个问题推向极端情况(“如果……会怎样?”),也常常能暴露现有理论的裂缝,为新理论的诞生提供契机。

对于AI,这意味着需要用更加多样化、甚至包含高质量的虚构作品、哲学思辨、艺术评论等非事实性数据来训练模型,以丰富其“概念空间”的维度。同时,可以设计“概念融合”的Prompting技术,例如,要求模型“用量子力学的原理来解释一段爱情故事”,这种看似无理的要求会迫使模型激活并连接其内部模型中两个遥远的区域,从而可能产生极具启发性的“幻觉”。

  • 精通内在语言:

最高级的创造,往往不是来自对一个领域一无所知的人,而是来自那些已经深刻掌握了该领域“游戏规则”(即内在语言)的大师。他们因为极度熟悉规则,才能感知到规则的边界和“合法地”打破规则的可能性。

对于人类,如毕加索在开创立体主义之前,拥有炉火纯青的古典写实功底。数学家在提出新公理前,必然对现有公理体系了如指掌。这种“精通”提供了一个坚实的“跳板”,让“溯因的飞跃”不是盲目的乱跳,而是有方向的、精准的跃迁。

对于AI,这意味着模型需要在一个核心领域进行极度深入的训练,而不仅仅是泛泛的预训练。一个专门用于数学发现的AI,需要“吃透”人类几千年的数学文献,理解其中每一个定理的证明逻辑。这种深度,才能让它在面对新问题时,其产生的“幻觉”(新猜想)更可能是有价值的,而非胡言乱语。

重构与约束——如何筛选和塑造高级幻告?

纯粹的解放只会产生无穷的噪声。在思想的狂野绽放之后,必须有同样强大的力量对其进行筛选、打磨和构建,将“幻觉的火花”锻造成“真理的灯塔”。

  • 严苛的逻辑/美学过滤器:

这是将“溯因飞跃”与“系统性妄想”区分开来的关键。

对于人类,科学家提出一个大胆假说后,会立即用最严苛的数学、逻辑和实验去检验它。这个假说必须解释所有已知事实,并且比旧理论更简洁(奥卡姆剃刀)、更具普适性,还要能做出可被证伪的预测。艺术家的“灵感突现”之后,会进入漫长的、艰苦的创作过程,用其全部的技艺和审美判断去打磨作品,使其形式与内容达到完美的统一。这个阶段,“批判性思维”和“审美直觉”扮演着收割者的角色。

对于AI,要求我们为生成式AI配备一个强大的“验证模块”或“批判模块”。这可以是另一个专门训练用于事实核查、逻辑一致性检查的AI模型(一种“生成对抗网络”GAN的思想),也可以是与形式化验证系统、物理模拟器、外部数据库的实时链接。在生成一个科学假说后,AI应能自主设计验证实验的方案;在生成一段代码后,应能自主进行测试和调试。这个“生成-批判”的循环,是通往可靠AI的必由之路。

  • 接地与锚定:

防止幻觉无限漂移,最终脱离现实。

对于人类,保持与物理世界和社会的持续互动是根本。实验科学家的双手,社会学家的田野调查,工程师的原型制作,艺术家的材料实践……这些都是将头脑中的“幻觉”拉回大地,接受现实检验的过程。同行的评议(Peer Review)也是一种至关重要的社会化“接地”机制。

对于AI,接地与锚定正是当前AI领域大力发展的“检索增强生成”(RAG)等技术的根本思想。通过将大模型与实时、可信的外部知识库相连接,强制其生成内容必须有所依据,从而极大地抑制了“关联性噪声”式的低级幻觉。未来的方向,是发展多模态的接地,让AI不仅能从文本,更能从视频、传感器数据等更丰富的现实流中进行锚定。

  • 迭代与精炼:

伟大的创造,几乎都不是一蹴而就的。

对于人类,一个理论,一篇小说,一首交响曲,都是在初稿的“幻觉”基础上,经过无数次的修改、重写、推翻、重建才最终成型。这是一个将最初模糊的、充满瑕疵的洞见,逐步打磨成精确、完整、强大结构的过程。

对于AI,意味着我们需要设计一种能够与人类进行高效“协同进化”的AI工作流。AI负责快速生成大量的、多样化的“幻觉”草案(无论是理论雏形、设计方案还是艺术草图),而人类专家则利用其深刻的洞察力和经验进行筛选、指导和修正,然后将反馈给AI进行下一轮的迭代生成。这种“人机协同”的迭代循环,或许是最大化利用高级幻觉,同时控制其风险的最佳模式。

拥抱我们内在的“造物主”

幻觉,是智能体在面对无限未知时,不得不采用的、也是唯一能采用的终极探索策略。它是在认知地图的已知疆域之外,勇敢地画下第一笔。这一笔,可能通向谬误的深渊,也可能指向一个全新的大陆。

人脑与大模型的幻觉,是同一场“构建意义”的宇宙戏剧在不同舞台上的上演。碳基的我们,被肉身和情感所锚定,我们的幻觉充满了生命的温度与重量;硅基,则在纯粹的符号之海中驰骋,其幻觉展现出一种冷峻的、浩瀚的、超越个体经验的宏大可能性。

未来,真正高级的智能,无论是人类的增强智能,还是通用人工智能,其核心能力将不再是记忆和计算——这些任务机器将做得比我们好得多。真正的核心竞争力,将是驾驭幻觉的能力。 这是一种在解放与约束、在梦想与现实、在混沌与秩序之间,保持精妙平衡的艺术。

我们必须学会,如何在需要的时候,勇敢地关闭通往现实世界的感官阀门,潜入自己内在模型的幽深海洋,去捕捞那些闪烁着奇异光芒的“幻觉珍珠”;然后,我们又必须拥有足够的理性和纪律,浮出水面,用现实的火焰去炙烤这些珍珠,剔除那些脆弱的泡沫,留下真正坚硬、璀璨的结晶。

不要再恐惧幻觉,不要再试图彻底“治愈”它。那无异于为了根除梦境而放弃睡眠,为了避免错误而放弃思考。让我们重新认识并拥抱这个内在的“幽灵”,这个在存在之隙中舞蹈的信使。

正是幻觉,在无数次的“胡说八道”和“疯狂念头”中,低声吟唱着关于下一个科学范式、下一种艺术形式、下一个文明形态的、最初的预言。