撰文 | Ian Stewart 翻译 | 何生 大脑功能的许多方面都可以被认为是某种决策。当我们观察外部世界时,视觉系统必须找出它所看到的物体,猜测这些物体的状况,评估它们潜在的威胁或收益,让我们根据这些评估采取行动。心理学家、行为科学家和人工智能工作者一致认为,在某些重要方面,大脑很像一台贝叶斯决策机。它体现了对世界的信念,这些信念短暂或永久地连入了脑的结构里,这使得它做出的决策与贝叶斯概率模型里出现的结果非常相似(之前我说过,我们对概率的直觉通常是相当糟糕的。它和这里的说法并不矛盾,因为这些概率模型的内部运作并不是可有意识地获取的)。 大脑是贝叶斯化的观点,解释了人类面对不确定性的许多其他特征。特别是,它有助于解释为什么迷信如此容易生根。贝叶斯统计主要阐释了概率是信念的程度。当我们评估某个概率是对半开的时候,实际上是说,我们愿意相信和不愿意相信它的程度相同。因此,我们的大脑已经进化到可以体现对世界的信念,而这些信念是短暂或永久地与大脑的结构连在一起的。 不光人类的大脑是这样工作的。我们的大脑结构可以追溯到遥远的过去,也就是那些哺乳动物甚至爬行动物的进化祖先。那些生物的大脑也体现了“信念”。它不是我们如今口头说的那种信念,比如“打破镜子会‘倒霉’七年”。大多数人类自己的大脑信念也并非如此。我指的是,诸如“倘若这样伸出舌头,我就更有可能捉到苍蝇”之类的信念,它被写进了大脑中用于激活相关肌肉的那些区域里。人类的语言额外为信念增加了一层,让表达信念成为可能,更重要的是,还把信念传递给其他人。 为了建立一个简单但又包含丰富信息的模型,我们假设大脑中有一个区域包含了许多神经元。它们可以通过具有“连接强度”的突触连在一起。有些神经元发出弱信号,而有些发出强信号,还有些根本不存在,所以不发出任何信号。信号越强,接收信号的神经元的反应就越大。我们还可以用数值表示强度,这在详细说明数学模型时很有用:用某些单位度量的话,可能弱连接的强度是0.2,强连接的强度是3.5,不存在的连接强度是0。 当神经元对传入的信号做出反应时,其电气状态会快速发生变化——它会“兴奋”。这样,就产生了一种可以传递给其他神经元的电脉冲,而传递给哪些神经元由网络的连接决定。当传入的信号把神经元的状态推到某个阈值以上时,神经元就会兴奋。而且,有两种不同类型的信号:一种是兴奋性的,它会使神经元兴奋;另一种则是抑制性的,它会使神经元停止兴奋。这就好像神经元会将传入信号的强度求和,兴奋性信号为正,抑制性信号为负,只有当和足够大时,神经元才会兴奋。 在新生儿的大脑中,许多神经元是随机连接的,但随着时间的推移,某些突触会改变它们的强度。有些突触可能会被完全移除,也会生长出一些新的突触。唐纳德·赫布(Donald Hebb)在神经网络里发现了一种“学习”的模式,这种模式如今被称为赫布型学习。“同时兴奋的神经细胞会连在一起”,也就是说,如果两个神经元几乎同步兴奋,那么它们之间的连接强度就会变大。在贝叶斯信念的语境里,连接的强度代表了大脑的信念程度,即当其中的一个神经元兴奋时,另一个也应该会兴奋。赫布型学习会强化大脑的信念结构。 一 心理学家发现,当人们被告知一些新信息时,不只是把它们记进脑子。从进化的角度来看,这会是灾难性的,因为相信别人告诉你的一切并不是一个好主意。人会说谎,试图误导别人,通常是为了能控制他们。大自然同样会说谎,经过仔细分析,摇摆的豹尾可能只是悬着的藤蔓或水果,竹节虫会假装成树枝。所以,当接收到新信息时,我们会根据自己已有的信念对其做出评估。如果足够机智,我们会评估信息的可信度。如果信息源可靠,我们更容易相信它;倘若信息源不可靠,那么我们就不太会相信它。是否接受新的信息,并据此转变自己的信念,是我们内心在权衡对已经相信的东西、它们与新信息之间的联系,以及对新信息真实性的信赖程度等因素后得到的结果。这种权衡通常发生在潜意识中,但我们也可以对信息进行有意识的演绎。 在一个自下而上的解释中,发生的事情就是复杂的神经元阵列都在兴奋,它们彼此发送信号。这些信号如何相互抵消,又怎样相互增强,决定 了新信息能否被接受,而连接强度也会随之改变。这已经解释了为什么很 难说服“真正的信徒”,让他们相信自己错了,即便证据对其他人而言似乎 具有压倒性。如果某人对不明飞行物有强烈的信念,而美国政府公布了一则新闻,解释某次所谓的目击实际上是一个气球实验,但他的贝叶斯大脑 几乎肯定会把这种解释当作宣传。新闻很可能会强化他们的信念,即他们 在这个问题上不信任美国政府,他们会庆幸自己没有轻信美国政府的谎言。信念是双向的,所以,通常在没有独立验证的情况下,那些不相信不明飞行物的人会把这种解释当作事实来接受,这些信息会强化他们不相信不明 飞行物的信念。他们会庆幸自己没有那么容易上当,去相信不明飞行物是存在的。 人类的文化和语言使一个大脑的信仰系统转移到另一个大脑成为可能。这个过程既不精准也不可靠,但它是有效的。根据不同的信仰和研究其过 程的人,“过程”的名字可以被当作“教育”“*”“把孩子培养成好人” 等。小孩的大脑是可塑的,他们评估证据的能力还在发展:想想圣诞老人、 牙仙和复活节小兔——尽管孩子们很聪明,很多孩子知道自己必须“演戏” 才能得到奖励。有一句格言:“让我把孩子培养到七岁,我就能塑造他的一生。”这句话可能有两种含义:一个含义是,年幼时学到的东西持续时间最长;另一个含义是,让孩子接受某种信仰体系,会让他们在成年后一直牢记。可能两者都是对的,而且从某种观点来看,它们是一样的。 二 贝叶斯大脑理论源自很多科学领域:除了显然的贝叶斯统计之外,还包括机器智能和心理学。19世纪60年代,人类感知物理学和心理学的先驱赫尔曼·亥姆霍兹(Hermann Helmholtz)提出,大脑通过建立外部世界的概率模型来组建认知。1983年,在人工智能领域工作的杰弗里·欣顿(Geoffrey Hinton)又提出,人类的大脑是一台机器,在观测外部世界时,它会对遇到的不确定性做出决策。20世纪90年代,这个思想成了基于概率论的数学模型,它包含了亥姆霍兹机的概念。它不是某种机械装置,而是一个数学抽象,由两个经过数学模型化的“神经元”网络组成。一个是自下而上的识别网络,它以真实数据作为训练对象,并通过一组隐变量表示。另一个是自上而下的“生成”网络,它生成这些隐变量的取值,由此得到数据。训练过程用一种学习算法来修改这两个网络的结构,使它们能够准确地对数据进行分类。这两个网络被轮流修改,整个过程被称为清醒–睡眠算法。 “深度学习”有更多层类似的结构,目前它在人工智能领域取得了相当大的成功。它的应用包括计算机对自然语言的识别,以及计算机在中国围棋中取得的胜利。在此之前,人们已经证明和计算机下西洋跳棋永远只能平局,即使打法再完美也只能如此。1996年,IBM的“深蓝”挑战国际象棋特级大师、世界冠军加里·卡斯帕罗夫(Garry Kasparov),但它在一场6局赛中以4∶2落败。经过大幅改良后,“深蓝”在随后的比赛中获胜。然而,这些程序用的都是暴力算法,而不是用来下赢围棋的人工智能算法。 围棋起源于2500多年前的中国,是在一个19×19的棋盘上进行的游戏,它表面上简单,实际上深不可测。两位棋手各执黑子和白子,把棋子轮流摆在棋盘上,将对方的子围住吃掉。谁围的地盘大,谁就获胜。围棋在数学上的严密分析非常有限。戴维·本森(David Benson)发明了一种算法,能判断出在什么情况下,无论对手如何落子,某块棋都不会被围住。埃尔温·贝勒坎普(Elwyn Berlekamp)和戴维·沃尔夫(David Wolfe)分析了一盘棋结束时复杂的数学情况,此时棋盘上的位置多被占领,可以落子的地方比平常更扑朔迷离。在那个阶段,游戏实际上已经分裂成好几块几乎相互独立的区域,棋手必须决定接下来在哪块区域落子。他们的数学技巧将每个位置与某个数值——或者说是更深奥的结构联系起来,并把这些数值组合起来,为获胜提供一些规则。 2015年,谷歌的深思(DeepMind)公司测试了一款围棋算法AlphaGo,这个算法基于两种深度学习网络:一种是决定棋盘盘面优势情况的价值网络,另一种是决定下一步行动的策略网络。这些网络采用人类高手对弈和算法互博的棋局训练。随后,AlphaGo与*职业棋手李世石(Lee Sedol)对弈,并以4∶1获胜。程序员找到了AlphaGo输了一局的原因,并修正了策略。2017年,AlphaGo在一场三局比赛中击败了世界排名第一的柯洁。AlphaGo的“棋风”有一个有趣的特点,表明深度学习算法并不需要像人脑那样运作。它经常会把棋子下在一些人类棋手根本不会考虑的位置——并最终取得胜利。柯洁说:“人类数千年的实战演练进化,计算机却告诉我们人类全都是错的。我觉得,甚至没有一个人沾到围棋真理的边。” 人工智能应该以与人类智能相同的方式工作,在逻辑上是没有道理的,这也是用形容词“人工”的一个原因。然而,这些由电子电路体现的数学结构,和神经科学家开发的大脑认知模型有一些相似之处。因此,在人工智能和认知科学之间出现了一个创造性的反馈回路,它们彼此借鉴对方的思路。有时候在某种程度上,我们的大脑和人造大脑似乎是利用相似的结构原理来工作的。然而,从构成的材料和信号处理过程的方式来看,它们的差别当然是非常大的。 三 我们大多数人在某种程度上经历过一种不确定性:“我在哪里?”神经学家爱德华(Edvard)、梅–布里特·莫泽(May-Britt Moser)和他们的学生在2005年发现,老鼠的大脑里有一种特殊的神经元,称为网格细胞,它可以模拟老鼠在空间里的位置。网格细胞位于大脑的某个区域,这个区域的名字有点拗口:背尾内侧内嗅皮层。它是位置和记忆的核心处理单元。就像视皮质一样,它也有一个分层的结构,并且不同层之间具有不同的兴奋模式。 科学家们将电极植入老鼠的大脑,然后让它们在一个开放的空间里自由活动。当老鼠移动时,他们监测老鼠大脑中有哪些细胞是兴奋的。事实证明,每当老鼠在众多空间小块(“兴奋区”)中的某块时,特定的细胞就会兴奋。这些小块区域构成一个六边形网格。研究人员推断,这些神经细胞构建了对空间的心理表征,即在某种坐标系统下的认知地图,告诉老鼠的大脑自己在哪里。网格细胞的活动随着动物的移动而不断更新。无论老鼠朝哪个方向走,有些细胞始终都会兴奋;另一些细胞则与方向有关,由此对方向做出反应。 我们还不清楚网格细胞是如何告诉老鼠自己在哪里的。有意思的是,老鼠大脑中网格细胞的几何排列是不规则的。这些网格细胞层通过整合老鼠四处游荡时的微小运动,以某种方式“计算”它所处的位置。在数学上,这一过程可以通过矢量计算来实现,在矢量计算中,运动物体的位置是将许多微小的变化相加后得到的,而这些变化是有大小和方向的。在更好的导航仪器被发明之前,水手们基本上就是用这种“航位推算法”导航的。 我们知道网格细胞的网络可以在没有任何视觉输入的情况下工作,因为即使在全黑的环境中,兴奋的模式也不会改变。不过,它对视觉输入的响应非常强烈。例如,假设老鼠在一个圆柱形的笼子里奔跑,笼壁上有一张卡片作为参考点。我们选择某个特定的网格神经元,并测量对应的由空间小块组成的网格。然后旋转圆柱体后再次测量,此时网格也会有同样的旋转。把老鼠放在一个新的环境后,网格及其间距都不会改变。无论网格细胞怎么计算位置,整个系统的稳健性都很好。 2018年,安德烈亚·巴尼诺(Andrea Banino)和他的同事们公布了如何使用深度学习网络执行类似导航任务。他们的网络有很多反馈回路,因为导航似乎依赖于把一个处理步骤的输出作为下步的输入,实际上,它是一个以网络为迭代函数的离散动力系统。他们利用各种啮齿类动物(如大鼠和小鼠)觅食时走过的路径,辅以大脑其他部分可能会发送到网格神经元的信息,来训练这个网络。 该网络学会了在各种环境中有效地导航,并且可以在不损失性能的情况下把所学内容转移到新的环境中。这个研究团队为它设置某个特定目标来进行测试,还在更高级的环境里(整个设置都是在计算机中模拟的)测试它通过迷宫的能力。他们使用贝叶斯方法评估统计显著性,并将数据拟合到由三个不同的正态分布组成的混合分布上。 其中有一个值得注意的结论是,随着学习过程的深入,在深度学习网络里,有一个中间层发展出了与网格神经元类似的活动,即当动物处于由空间小块组成的网格中的某个区域时,它就会变得兴奋起来。对网络结构的详细数学分析表明,这是某种模拟的矢量计算。没有理由假设网络会像数学家那样,写下矢量后把它们加起来。尽管如此,他们的结果支持了一个理论,那就是网格细胞对基于矢量的导航而言至关重要。 四 更笼统地说,大脑用来理解外部世界的“回路”是在某种程度上模仿外部世界。大脑的结构已经进化了几十万年,“连接”着我们周遭的信息。正如我们所了解的,它也会在较短的时间内发生变化,学习“优化”连接结构。我们学到的东西受教育所限。因此,如果我们从小就被灌输某些信念,它们就会根深蒂固地扎在我们的大脑里。这可以看作对前文提到的那句格言在神经科学上的验证。 于是,成长环境强力地约束着文化信念。我们通过熟悉的赞美诗、支持的球队、演奏的音乐来确定自己在世界上的位置,以及与周围人的关系。对多数人而言,刻在我们的大脑里的“信仰”,和那些可以利用证据进行理性辩论的东西并没有太大不同。但是,除非认识到两者的区别,否则我们所持的那些没有证据支持的信仰很可能是有问题的。不幸的是,这些信仰在我们的文化中非常重要,这也是它们始终存在的原因之一。建立在信仰而非证据基础之上的信念对区分“我们”和“他们”很有效。是的,我们都“相信”2+2=4,所以它不会让你我有所不同。但是,你会在每周三都向猫女神祈祷吗?我认为你不会。你不是“我们”的一分子。 当我们在小团体中生活时,这种方法非常有效,因为我们遇到的几乎每一个人都会向猫女神祈祷,倘若不这样做,可能就会遭到警告。然而,哪怕只是把这种行为推广到族群里,也有可能引发矛盾,甚至经常导致暴力事件。在当今这个互联的世界里,它正成为一个大灾难。 眼下,民粹主义政治用新词“假新闻”来形容那些曾被称为“谎言”或“宣传”的东西。辨别真假新闻越来越难了。任何一个有几百美元闲钱的人都能掌握巨大的计算力。高级软件的广泛使用正让全球变得民主化,这在原则上是件好事,但随之而来的,常常是使区分真理与谎言也变得更复杂。 因为用户可以定制他们所看到的信息,强化自己的偏好,所以人们越来越容易生活在信息泡沫里,你能得到的唯一新闻就是你想听到的。柴纳·米耶维尔(China Miéville)在《城与城》中夸张地表述了这种倾向,这部科幻–犯罪类剧集讲的是贝斯厄尔市重案组的博尔洛探长调查凶手的故事。他多次跨越城际线,前往该市的姊妹城厄尔科马市,与那里的警察合作。一开始,剧集的画风有点儿像柏林墙倒塌前,城市被分为东西两部分的柏林,但你会慢慢发现,这座城市的两部分在地理空间上是相同的。每一个城市的市民从呱呱坠地起就被训练视对方为无物,即使他们穿梭于对方的建筑物和人群中。如今,许多人在互联网上也做着相同的事情,他们沉迷于确认偏差,因此我们收到的所有信息都在加强一个观点,那就是自己是正确的。 为什么我们会如此轻易地被假新闻操纵?这是因为古老的贝叶斯大脑是基于具体信念的。我们的信念不像计算机里的文件,只要动一下鼠标就可以删除或替换。它们更像是连在一起的硬件。改变连接模式很困难。我们越是坚信,哪怕只是试图相信,改变也就越难。我们相信的每一条假新闻,都会强化那些连接,因为它符合我们的需要。每一条我们不想相信的新闻都被无视了。 我不知道有什么好办法可以避免这类情况。教育吗?如果某个孩子去了一所宣扬特定信念的特殊学校,会发生什么呢?如果禁止教授那些事实明确但与信念不同的学科,又会发生什么呢?到目前为止,在人类所有的发明设计里,科学是区分事实和虚构的最佳方法,但如果政府决定削减研究这些令人不快的事实的经费来对付它们,那会发生什么呢?在美国,联邦资金已经不能用于合法研究持枪权带来的影响了,特朗普政府就曾考虑对气候变化做相同的事情。 各位,事实是不会就此消失的。 有一种建议是,我们需要新的监督者。但是一个无神论者信任的网站对一个真正的教徒而言就是诅咒,反之亦然。如果某个邪恶的公司控制了我们信任的网站,会发生什么?这一直不是一个新问题。正如古罗马诗人尤维纳利斯(Juvenal)在公元100年左右写就的《讽刺诗》中所说的那样,谁来监督监督者?谁来监视那些监视者本人?不过,我们今天面临的问题更糟糕,因为一条推文就可以传遍整个地球。 也许,我太悲观了。总体而言,更好的教育使人们更加理性。当人类生活在洞穴和丛林里时,贝叶斯大脑“迅速而粗糙”的生存算法提供了很好的帮助;但在充斥着错误信息的时代,它可能不再适用了。 作者简介 伊恩·斯图尔特(Ian Stewart),英国沃里克大学数学系荣退教授,英国皇家学会会员。曾获英国皇家学会的法拉第奖章,美国科学促进会的“公众理解科学技术奖”和英国伦敦数学学会与英国数学及应用研究院颁发的“赛曼奖章”。
目录
撰文 | Ian Stewart 翻译 | 何生 大脑功能的许多方面都可以被认为是某种决策。当我们观察外部世界时,视觉系统必须找出它所看到的物体,猜测这些物体的状况,评估它们潜在的威胁或收益,让我们根据这些评估采取行动。心理学家、行为科学家和人工智能工作者一致认为,在某些重要方面,大脑很像一台贝叶斯决策机。它体现了对世界的信念,这些信念短暂或永久地连入了脑的结构里,这使得它做出的决策与贝叶斯概率模型里出现的结果非常相似(之前我说过,我们对概率的直觉通常是相当糟糕的。它和这里的说法并不矛盾,因为这些概率模型的内部运作并不是可有意识地获取的)。 大脑是贝叶斯化的观点,解释了人类面对不确定性的许多其他特征。特别是,它有助于解释为什么迷信如此容易生根。贝叶斯统计主要阐释了概率是信念的程度。当我们评估某个概率是对半开的时候,实际上是说,我们愿意相信和不愿意相信它的程度相同。因此,我们的大脑已经进化到可以体现对世界的信念,而这些信念是短暂或永久地与大脑的结构连在一起的。 不光人类的大脑是这样工作的。我们的大脑结构可以追溯到遥远的过去,也就是那些哺乳动物甚至爬行动物的进化祖先。那些生物的大脑也体现了“信念”。它不是我们如今口头说的那种信念,比如“打破镜子会‘倒霉’七年”。大多数人类自己的大脑信念也并非如此。我指的是,诸如“倘若这样伸出舌头,我就更有可能捉到苍蝇”之类的信念,它被写进了大脑中用于激活相关肌肉的那些区域里。人类的语言额外为信念增加了一层,让表达信念成为可能,更重要的是,还把信念传递给其他人。 为了建立一个简单但又包含丰富信息的模型,我们假设大脑中有一个区域包含了许多神经元。它们可以通过具有“连接强度”的突触连在一起。有些神经元发出弱信号,而有些发出强信号,还有些根本不存在,所以不发出任何信号。信号越强,接收信号的神经元的反应就越大。我们还可以用数值表示强度,这在详细说明数学模型时很有用:用某些单位度量的话,可能弱连接的强度是0.2,强连接的强度是3.5,不存在的连接强度是0。 当神经元对传入的信号做出反应时,其电气状态会快速发生变化——它会“兴奋”。这样,就产生了一种可以传递给其他神经元的电脉冲,而传递给哪些神经元由网络的连接决定。当传入的信号把神经元的状态推到某个阈值以上时,神经元就会兴奋。而且,有两种不同类型的信号:一种是兴奋性的,它会使神经元兴奋;另一种则是抑制性的,它会使神经元停止兴奋。这就好像神经元会将传入信号的强度求和,兴奋性信号为正,抑制性信号为负,只有当和足够大时,神经元才会兴奋。 在新生儿的大脑中,许多神经元是随机连接的,但随着时间的推移,某些突触会改变它们的强度。有些突触可能会被完全移除,也会生长出一些新的突触。唐纳德·赫布(Donald Hebb)在神经网络里发现了一种“学习”的模式,这种模式如今被称为赫布型学习。“同时兴奋的神经细胞会连在一起”,也就是说,如果两个神经元几乎同步兴奋,那么它们之间的连接强度就会变大。在贝叶斯信念的语境里,连接的强度代表了大脑的信念程度,即当其中的一个神经元兴奋时,另一个也应该会兴奋。赫布型学习会强化大脑的信念结构。 一 心理学家发现,当人们被告知一些新信息时,不只是把它们记进脑子。从进化的角度来看,这会是灾难性的,因为相信别人告诉你的一切并不是一个好主意。人会说谎,试图误导别人,通常是为了能控制他们。大自然同样会说谎,经过仔细分析,摇摆的豹尾可能只是悬着的藤蔓或水果,竹节虫会假装成树枝。所以,当接收到新信息时,我们会根据自己已有的信念对其做出评估。如果足够机智,我们会评估信息的可信度。如果信息源可靠,我们更容易相信它;倘若信息源不可靠,那么我们就不太会相信它。是否接受新的信息,并据此转变自己的信念,是我们内心在权衡对已经相信的东西、它们与新信息之间的联系,以及对新信息真实性的信赖程度等因素后得到的结果。这种权衡通常发生在潜意识中,但我们也可以对信息进行有意识的演绎。 在一个自下而上的解释中,发生的事情就是复杂的神经元阵列都在兴奋,它们彼此发送信号。这些信号如何相互抵消,又怎样相互增强,决定 了新信息能否被接受,而连接强度也会随之改变。这已经解释了为什么很 难说服“真正的信徒”,让他们相信自己错了,即便证据对其他人而言似乎 具有压倒性。如果某人对不明飞行物有强烈的信念,而美国政府公布了一则新闻,解释某次所谓的目击实际上是一个气球实验,但他的贝叶斯大脑 几乎肯定会把这种解释当作宣传。新闻很可能会强化他们的信念,即他们 在这个问题上不信任美国政府,他们会庆幸自己没有轻信美国政府的谎言。信念是双向的,所以,通常在没有独立验证的情况下,那些不相信不明飞行物的人会把这种解释当作事实来接受,这些信息会强化他们不相信不明 飞行物的信念。他们会庆幸自己没有那么容易上当,去相信不明飞行物是存在的。 人类的文化和语言使一个大脑的信仰系统转移到另一个大脑成为可能。这个过程既不精准也不可靠,但它是有效的。根据不同的信仰和研究其过 程的人,“过程”的名字可以被当作“教育”“*”“把孩子培养成好人” 等。小孩的大脑是可塑的,他们评估证据的能力还在发展:想想圣诞老人、 牙仙和复活节小兔——尽管孩子们很聪明,很多孩子知道自己必须“演戏” 才能得到奖励。有一句格言:“让我把孩子培养到七岁,我就能塑造他的一生。”这句话可能有两种含义:一个含义是,年幼时学到的东西持续时间最长;另一个含义是,让孩子接受某种信仰体系,会让他们在成年后一直牢记。可能两者都是对的,而且从某种观点来看,它们是一样的。 二 贝叶斯大脑理论源自很多科学领域:除了显然的贝叶斯统计之外,还包括机器智能和心理学。19世纪60年代,人类感知物理学和心理学的先驱赫尔曼·亥姆霍兹(Hermann Helmholtz)提出,大脑通过建立外部世界的概率模型来组建认知。1983年,在人工智能领域工作的杰弗里·欣顿(Geoffrey Hinton)又提出,人类的大脑是一台机器,在观测外部世界时,它会对遇到的不确定性做出决策。20世纪90年代,这个思想成了基于概率论的数学模型,它包含了亥姆霍兹机的概念。它不是某种机械装置,而是一个数学抽象,由两个经过数学模型化的“神经元”网络组成。一个是自下而上的识别网络,它以真实数据作为训练对象,并通过一组隐变量表示。另一个是自上而下的“生成”网络,它生成这些隐变量的取值,由此得到数据。训练过程用一种学习算法来修改这两个网络的结构,使它们能够准确地对数据进行分类。这两个网络被轮流修改,整个过程被称为清醒–睡眠算法。 “深度学习”有更多层类似的结构,目前它在人工智能领域取得了相当大的成功。它的应用包括计算机对自然语言的识别,以及计算机在中国围棋中取得的胜利。在此之前,人们已经证明和计算机下西洋跳棋永远只能平局,即使打法再完美也只能如此。1996年,IBM的“深蓝”挑战国际象棋特级大师、世界冠军加里·卡斯帕罗夫(Garry Kasparov),但它在一场6局赛中以4∶2落败。经过大幅改良后,“深蓝”在随后的比赛中获胜。然而,这些程序用的都是暴力算法,而不是用来下赢围棋的人工智能算法。 围棋起源于2500多年前的中国,是在一个19×19的棋盘上进行的游戏,它表面上简单,实际上深不可测。两位棋手各执黑子和白子,把棋子轮流摆在棋盘上,将对方的子围住吃掉。谁围的地盘大,谁就获胜。围棋在数学上的严密分析非常有限。戴维·本森(David Benson)发明了一种算法,能判断出在什么情况下,无论对手如何落子,某块棋都不会被围住。埃尔温·贝勒坎普(Elwyn Berlekamp)和戴维·沃尔夫(David Wolfe)分析了一盘棋结束时复杂的数学情况,此时棋盘上的位置多被占领,可以落子的地方比平常更扑朔迷离。在那个阶段,游戏实际上已经分裂成好几块几乎相互独立的区域,棋手必须决定接下来在哪块区域落子。他们的数学技巧将每个位置与某个数值——或者说是更深奥的结构联系起来,并把这些数值组合起来,为获胜提供一些规则。 2015年,谷歌的深思(DeepMind)公司测试了一款围棋算法AlphaGo,这个算法基于两种深度学习网络:一种是决定棋盘盘面优势情况的价值网络,另一种是决定下一步行动的策略网络。这些网络采用人类高手对弈和算法互博的棋局训练。随后,AlphaGo与*职业棋手李世石(Lee Sedol)对弈,并以4∶1获胜。程序员找到了AlphaGo输了一局的原因,并修正了策略。2017年,AlphaGo在一场三局比赛中击败了世界排名第一的柯洁。AlphaGo的“棋风”有一个有趣的特点,表明深度学习算法并不需要像人脑那样运作。它经常会把棋子下在一些人类棋手根本不会考虑的位置——并最终取得胜利。柯洁说:“人类数千年的实战演练进化,计算机却告诉我们人类全都是错的。我觉得,甚至没有一个人沾到围棋真理的边。” 人工智能应该以与人类智能相同的方式工作,在逻辑上是没有道理的,这也是用形容词“人工”的一个原因。然而,这些由电子电路体现的数学结构,和神经科学家开发的大脑认知模型有一些相似之处。因此,在人工智能和认知科学之间出现了一个创造性的反馈回路,它们彼此借鉴对方的思路。有时候在某种程度上,我们的大脑和人造大脑似乎是利用相似的结构原理来工作的。然而,从构成的材料和信号处理过程的方式来看,它们的差别当然是非常大的。 三 我们大多数人在某种程度上经历过一种不确定性:“我在哪里?”神经学家爱德华(Edvard)、梅–布里特·莫泽(May-Britt Moser)和他们的学生在2005年发现,老鼠的大脑里有一种特殊的神经元,称为网格细胞,它可以模拟老鼠在空间里的位置。网格细胞位于大脑的某个区域,这个区域的名字有点拗口:背尾内侧内嗅皮层。它是位置和记忆的核心处理单元。就像视皮质一样,它也有一个分层的结构,并且不同层之间具有不同的兴奋模式。 科学家们将电极植入老鼠的大脑,然后让它们在一个开放的空间里自由活动。当老鼠移动时,他们监测老鼠大脑中有哪些细胞是兴奋的。事实证明,每当老鼠在众多空间小块(“兴奋区”)中的某块时,特定的细胞就会兴奋。这些小块区域构成一个六边形网格。研究人员推断,这些神经细胞构建了对空间的心理表征,即在某种坐标系统下的认知地图,告诉老鼠的大脑自己在哪里。网格细胞的活动随着动物的移动而不断更新。无论老鼠朝哪个方向走,有些细胞始终都会兴奋;另一些细胞则与方向有关,由此对方向做出反应。 我们还不清楚网格细胞是如何告诉老鼠自己在哪里的。有意思的是,老鼠大脑中网格细胞的几何排列是不规则的。这些网格细胞层通过整合老鼠四处游荡时的微小运动,以某种方式“计算”它所处的位置。在数学上,这一过程可以通过矢量计算来实现,在矢量计算中,运动物体的位置是将许多微小的变化相加后得到的,而这些变化是有大小和方向的。在更好的导航仪器被发明之前,水手们基本上就是用这种“航位推算法”导航的。 我们知道网格细胞的网络可以在没有任何视觉输入的情况下工作,因为即使在全黑的环境中,兴奋的模式也不会改变。不过,它对视觉输入的响应非常强烈。例如,假设老鼠在一个圆柱形的笼子里奔跑,笼壁上有一张卡片作为参考点。我们选择某个特定的网格神经元,并测量对应的由空间小块组成的网格。然后旋转圆柱体后再次测量,此时网格也会有同样的旋转。把老鼠放在一个新的环境后,网格及其间距都不会改变。无论网格细胞怎么计算位置,整个系统的稳健性都很好。 2018年,安德烈亚·巴尼诺(Andrea Banino)和他的同事们公布了如何使用深度学习网络执行类似导航任务。他们的网络有很多反馈回路,因为导航似乎依赖于把一个处理步骤的输出作为下步的输入,实际上,它是一个以网络为迭代函数的离散动力系统。他们利用各种啮齿类动物(如大鼠和小鼠)觅食时走过的路径,辅以大脑其他部分可能会发送到网格神经元的信息,来训练这个网络。 该网络学会了在各种环境中有效地导航,并且可以在不损失性能的情况下把所学内容转移到新的环境中。这个研究团队为它设置某个特定目标来进行测试,还在更高级的环境里(整个设置都是在计算机中模拟的)测试它通过迷宫的能力。他们使用贝叶斯方法评估统计显著性,并将数据拟合到由三个不同的正态分布组成的混合分布上。 其中有一个值得注意的结论是,随着学习过程的深入,在深度学习网络里,有一个中间层发展出了与网格神经元类似的活动,即当动物处于由空间小块组成的网格中的某个区域时,它就会变得兴奋起来。对网络结构的详细数学分析表明,这是某种模拟的矢量计算。没有理由假设网络会像数学家那样,写下矢量后把它们加起来。尽管如此,他们的结果支持了一个理论,那就是网格细胞对基于矢量的导航而言至关重要。 四 更笼统地说,大脑用来理解外部世界的“回路”是在某种程度上模仿外部世界。大脑的结构已经进化了几十万年,“连接”着我们周遭的信息。正如我们所了解的,它也会在较短的时间内发生变化,学习“优化”连接结构。我们学到的东西受教育所限。因此,如果我们从小就被灌输某些信念,它们就会根深蒂固地扎在我们的大脑里。这可以看作对前文提到的那句格言在神经科学上的验证。 于是,成长环境强力地约束着文化信念。我们通过熟悉的赞美诗、支持的球队、演奏的音乐来确定自己在世界上的位置,以及与周围人的关系。对多数人而言,刻在我们的大脑里的“信仰”,和那些可以利用证据进行理性辩论的东西并没有太大不同。但是,除非认识到两者的区别,否则我们所持的那些没有证据支持的信仰很可能是有问题的。不幸的是,这些信仰在我们的文化中非常重要,这也是它们始终存在的原因之一。建立在信仰而非证据基础之上的信念对区分“我们”和“他们”很有效。是的,我们都“相信”2+2=4,所以它不会让你我有所不同。但是,你会在每周三都向猫女神祈祷吗?我认为你不会。你不是“我们”的一分子。 当我们在小团体中生活时,这种方法非常有效,因为我们遇到的几乎每一个人都会向猫女神祈祷,倘若不这样做,可能就会遭到警告。然而,哪怕只是把这种行为推广到族群里,也有可能引发矛盾,甚至经常导致暴力事件。在当今这个互联的世界里,它正成为一个大灾难。 眼下,民粹主义政治用新词“假新闻”来形容那些曾被称为“谎言”或“宣传”的东西。辨别真假新闻越来越难了。任何一个有几百美元闲钱的人都能掌握巨大的计算力。高级软件的广泛使用正让全球变得民主化,这在原则上是件好事,但随之而来的,常常是使区分真理与谎言也变得更复杂。 因为用户可以定制他们所看到的信息,强化自己的偏好,所以人们越来越容易生活在信息泡沫里,你能得到的唯一新闻就是你想听到的。柴纳·米耶维尔(China Miéville)在《城与城》中夸张地表述了这种倾向,这部科幻–犯罪类剧集讲的是贝斯厄尔市重案组的博尔洛探长调查凶手的故事。他多次跨越城际线,前往该市的姊妹城厄尔科马市,与那里的警察合作。一开始,剧集的画风有点儿像柏林墙倒塌前,城市被分为东西两部分的柏林,但你会慢慢发现,这座城市的两部分在地理空间上是相同的。每一个城市的市民从呱呱坠地起就被训练视对方为无物,即使他们穿梭于对方的建筑物和人群中。如今,许多人在互联网上也做着相同的事情,他们沉迷于确认偏差,因此我们收到的所有信息都在加强一个观点,那就是自己是正确的。 为什么我们会如此轻易地被假新闻操纵?这是因为古老的贝叶斯大脑是基于具体信念的。我们的信念不像计算机里的文件,只要动一下鼠标就可以删除或替换。它们更像是连在一起的硬件。改变连接模式很困难。我们越是坚信,哪怕只是试图相信,改变也就越难。我们相信的每一条假新闻,都会强化那些连接,因为它符合我们的需要。每一条我们不想相信的新闻都被无视了。 我不知道有什么好办法可以避免这类情况。教育吗?如果某个孩子去了一所宣扬特定信念的特殊学校,会发生什么呢?如果禁止教授那些事实明确但与信念不同的学科,又会发生什么呢?到目前为止,在人类所有的发明设计里,科学是区分事实和虚构的最佳方法,但如果政府决定削减研究这些令人不快的事实的经费来对付它们,那会发生什么呢?在美国,联邦资金已经不能用于合法研究持枪权带来的影响了,特朗普政府就曾考虑对气候变化做相同的事情。 各位,事实是不会就此消失的。 有一种建议是,我们需要新的监督者。但是一个无神论者信任的网站对一个真正的教徒而言就是诅咒,反之亦然。如果某个邪恶的公司控制了我们信任的网站,会发生什么?这一直不是一个新问题。正如古罗马诗人尤维纳利斯(Juvenal)在公元100年左右写就的《讽刺诗》中所说的那样,谁来监督监督者?谁来监视那些监视者本人?不过,我们今天面临的问题更糟糕,因为一条推文就可以传遍整个地球。 也许,我太悲观了。总体而言,更好的教育使人们更加理性。当人类生活在洞穴和丛林里时,贝叶斯大脑“迅速而粗糙”的生存算法提供了很好的帮助;但在充斥着错误信息的时代,它可能不再适用了。 作者简介 伊恩·斯图尔特(Ian Stewart),英国沃里克大学数学系荣退教授,英国皇家学会会员。曾获英国皇家学会的法拉第奖章,美国科学促进会的“公众理解科学技术奖”和英国伦敦数学学会与英国数学及应用研究院颁发的“赛曼奖章”。