AI学语言与人腦极为相似！新研究证明：语言并非人类与生特有的能力，机器也能学 - 大酷樂

今天小编分享的科学经验：AI学语言与人腦极为相似！新研究证明：语言并非人类与生特有的能力，机器也能学，欢迎阅读。

人工神经网络（ANN）的学习方式，竟然与人腦极为相似！

你没听错，至少在处理语言这块上，机器似乎更像人了。

先看下面这张图：

蓝色代表的是人的腦电波信号，红色代表的是人工神经网络信号。

而这是人腦和机器听同一个语音时所作出的反应。

是不是非常相似，有木有被惊到？

实际上这张图来源于最近的一项研究，相关论文已被发表在了 Nature 子刊 Scientific reports 上。

而此前，关于人的大腦以及机器的大腦是如何进行学习的问题，始终是一个谜。

" 神经网络的学习方式是否与人类相同 " 这个话题，也一直存在争议。

所以到底有什么证据可以证明，人类和机器 " 很可能是以类似的方式处理语言 "？

人工神经网络信号与人腦电波信号非常匹配

为了揭开人工神经网络学习的神秘面纱，加州大学伯克利分校的计算语言学家 Ga š per Begu š 与约翰霍普金斯大学的博士生 Alan Zhou、华盛顿大学神经科学家 Christina Zhao 进行了这项研究。

在这项研究中，他们给人类听一种简单的声音，然后收集人类听到声音后产生的腦电波。同时，将同一种声音输入到神经网络中，分析神经网络所产生的信号。

对两者进行比较，结果竟然出奇相似。

最重要的是，研究人员测试了适用于各种任务的通用神经元组成的网络，即使是非常通用的网络 ( 对语音或其它声音没有偏见 ) ，仍然展现出与人类神经编码的对应关系。

那这项研究具体是怎样进行的呢？

首先，为了更好地对比人类大腦与人工神经网络的反应情况，研究人员分别找来了 14 名说英语的人和 15 名说西班牙语的人。

然后对这些人播放了一个单音节音频—— "bah"，每次播放 8 分钟，重复两次。

在播放的过程中，研究人员记录了每个听众腦干中神经元平均电活动的波动情况（腦干是大腦中最先处理声音的部分）。

另外，研究人员将相同的 "bah" 声音输入到两组不同的神经网络中。其中一组神经网络是经过英语训练的，另一组是经过西班牙语训练的。

研究人员选择的神经网络结构是生成式对抗网络（GAN）。

GAN 最早在 2014 年被提出，用于生成影像。GAN 由两个模块组成，分别是判别器（discriminator）和生成器（generator），它们之间相互博弈学习，可以产生更好的输出。

具体来说，生成器创建一个影像或声音的样本，判别器确定它与训练样本的接近程度并提供反馈，导致生成器再次反应，如此循环，直到 GAN 能够输出期望的结果。

而在这项研究中，判别器最初是在一系列英语或西班牙语的声音上进行训练的。

然后，从未接受过这些声音训练的生成器必须找到一种产生它们的方法。它开始制造随机的声音，经过约 40,000 次与判别器的互動后，生成器逐渐产生了正确的声音。经过这种训练，判别器也变得更善于区分真实声音以及生成的声音。

在判别器经过训练之后，研究人员就开始播放 "bah" 的声音。它们测量了判别器人工神经元的平均活动水平的波动，记录了神经网络的处理活动，重点关注了网络中用于分析声音的人工神经元层（以模拟腦干读数）。

将采集到的人腦电波信号与人工神经网络信号进行比较，结果见下图：

△使用英语的实验结果：蓝色是人腦电波，红色是人工神经网络信号

△使用西班牙语的实验结果：蓝色是人腦电波，红色是人工神经网络信号

可以发现，这些人工神经网络信号与人腦电波信号非常匹配！

这也就说明了这两个系统正在进行类似的活动。

此外，这项实验还揭示了人类和机器之间的另一个有趣的相似之处。腦电波显示，说英语和说西班牙语的测试者对 "bah" 声音有不同的听觉感知（说西班牙语的人更多地听到了 "pah" 的声音）。

而 GAN 的信号也显示出了：接受英语训练的网络在处理声音时，与接受西班牙语训练的网络有些不同。

" 而这些差异是朝着同一个方向产生的，"Begu š 解释道。

说英语的人的腦干对 "bah" 声音的反应比说西班牙语的人稍微早一些，而受过英语训练的 GAN 对相同的声音的反应也比受过西班牙语训练的模型稍微早一些。

人类与机器的这种反应时间上的差异几乎是相同的，大约是千分之一秒。

这也为 Begu š 提供了额外的证据，即人类和人工网络 " 很可能是以类似的方式处理语言。"

乔姆斯基错了？

这项研究的结论，实际上与上世纪 50 年代语言学家乔姆斯基（Noam Chomsky）提出的 " 人类天生就具有理解语言的能力，这种能力与人腦是硬连接（hard-wired）" 的观点相违背。

此外，乔姆斯基还提出了普遍语法（Universal Grammar）概念，即人腦普遍有一种语言习得机制，使人们能够学会使用语言。

难道，乔姆斯基的观点是错误的？

对此，有网友表示：

ChatGPT 已经证明了学习语言以及理解语言并不需要语法。

也有网友保持怀疑态度：

人腦和神经网络并不是一回事，我们应该对通过研究神经网络的计算时间来研究人腦保持怀疑。

此外，该神经网络已经用人类语言进行了训练，所以这个说法也不能从观察到的时间推断出来。

Begu š 则表示：这场辩论尚未结束。

△Ga š per Begu š

他表示自己还将进一步探索人腦和神经网络之间的相似之处，例如，他正在测试大腦皮层发出的腦电波（在腦干完成其部分听觉处理后）是否与 GAN 更深层产生的信号相对应。

他们希望最终能够开发一个可靠的语言习得模型（language-acquisition model），用来描述机器和人类如何学习语言，从而进行在人类实验对象中无法进行的实验。

Begu š 研究团队成员，华盛顿大学的神经科学家 Christina Zhao 表示：

例如，我们可以创造一个不良的环境，比如一个被忽视的婴儿，然后观察是否会导致类似语言障碍的情况。

此外，Begu š 还说正在尝试看看这条路能够走多远，通用神经元能够多接近人类语言。

我们能否通过扩大和增强我们的计算架构，让其性能达到与人类相当的水平，或者能够证明这永远是不可能的。

在我们确切知道这个问题之前，还需要做更多的工作。但我们对这些系统的内部运作，对人类和人工神经网络的相似之处，依然感到非常惊讶。

对于人腦与人工神经网络你有什么看法？

传送门：

[ 1 ] https://www.nature.com/articles/s41598-023-33384-9（论文链接）

参考链接：

[ 1 ] https://www.quantamagazine.org/some-neural-networks-learn-language-like-humans-20230522/