今天小编分享的互联网经验:AI可以识别气味了!谷歌绘制首个嗅觉图谱,可分辨50万种气味,欢迎阅读。
编辑|尚恩
编辑|邓咏仪
你敢信,AI 可以识别气味了,准确度甚至已经超过人类!这不是危言耸听,而是来自真实的研究结果。
最近,来自 Google Research、 Osmo Lab 等多个机构研究团队人员在 Science 上发文,声称 AI 模型可以让机器拥有比人类具有更好的嗅觉。
来源:Science
论文中,研究人员提出了一种由数据驱动的人类嗅觉高维图谱(POM),这个图谱可以逼真地再现由单一分子诱发的气味感知类别的结构和关系,还能够预测未知气味的性质。
研究证明,机器学习模型在理解和描述气味上,已经达到人类水平。并且,在气味描述的前瞻性预测上,AI 的准确度也已赶超人类…
对此就有网友惊呼道:
视觉听觉嗅觉都有了,还差触觉就是一个真正的人形 AI 了!
来源:Twitter
也有一些网友半信半疑的表示,所以现在 AI 都能像人一样拥有嗅觉了?
用神经网络识别气味
首先,我们需要了解在神经科学中,视觉、听觉的工作原理是将刺激的物理特性映射到对应的知觉特征上。比如听觉中,频率与音调相对应,耳朵听到声音的高低音调,大腦也会有对应的听觉感受。
目前,对于视觉和听觉,学界已有了完善的图谱将物理属性(如频率和波长)和感知属性(如音高和颜色)相关联。
来源:公开网络
同理,为了让机器更好地理解嗅觉,也就需要一个更好的映射图谱。但目前为止,化学结构与嗅觉感知之间的映射关系尚不明确。
因此,为了让机器理解并感受到嗅觉,研究团队创建了一个机器学习模型消息传递神经网络(MPNN),一个能将化学结构映射到气味感知中的图神经网络(GNN)。
为了绘制分子结构如何与分子气味相对应的映射,研究人员建立了一个约 5000 个分子的参考数据集,每个分子都有多个气味标签,比如果味、花香等。
在这个数据集中,数据输入是分子的形状,输出是对哪些气味词最能描述其气味的预测。
然后,基于这个神经网络,为了检验数据驱动的图谱(POM)是否靠谱,能像人类一样识别不同气味,研究人员选择通过测量映射在表征真实相对知觉距离。
至于为什么要测量这个距离,举个简单的例子。
如果两种花香气味人类嗅觉感知上很接近,它们的空间距离也会较近。而如果是把花香与肉香放在一起,距离就会很远,因为人类嗅觉能明显地将它们区分开来。通过比较这个知觉距离,就可以检验模型是否准确模拟了人类的嗅觉。
实验结果证明,相比人类用鼻闻,数据驱动的图谱(POM)能够更好地用表征相对距离和知觉层次结构来识别气味。
总结就是,使用图形网络模型的 POM 表示出来的气味关系,和真实世界中的气味关系非常接近。
而使用标准化学信息的气味映射,表示出来的气味关系与真实世界的差得比较远。
AI 气味描述能力赶超人类
因为气味知觉在不同个体之间存在差异性,为了和人类对比确定这个模型的有效性,能否扩展到新的气味上。
研究人员特别请来了 15 位专家组成员,让他们嗅出 400 种气味,并事先给了他们 55 个词来描述每种气味,要求他们对每一种气味用 1 到 5 分来打分,来评定这个术语在多大程度上适合于这个气味。
研究人员按气味标签对其性能进行了分类,然后将模型与个人小组成员的表现进行了比较。
结果发现,除了对于麝香这样的复杂标签外,模型对小组气味评级平均值的预测比任何一个小组成员都要好。具体来说,在 53% 的测试分子中,模型的表现都优于小组成员的平均值。
按标签划分的结果表明,GNN 模型甚至优于之前在相同数据上训练的最先进模型(SOTA)。
另外,为了测试模型在结构 - 气味距离不连续性方面的稳健性,研究团队还额外设计了一系列测试。
他们选择一个已知气味的分子 A 作为基准,与一个结构很相似的新分子 B 以及一个结构不同的新分子 C 进行比较。
结果发现,人类通常会判断 A 与结构不同的 C 气味更接近,而不是与结构相似的 B 更接近。这说明模型可以判断出连结构不同但气味很近的分子,不会被外在结构相似性迷惑,而是像人类一样根据实际气味相似度进行预测。
模型可以克服结构 - 气味关系的不连续性,不会被分子结构的相似性误导气味距离。比如,过去人类总会将霉味和麝香混为一谈,而大模型就不会了。
实验团队提出方法,不仅可以找到很多结构不同但气味其实非常相似的分子,还可以预测一个新分子可能会有怎样的气味特性,比如这种气味强不强。而通过模型可以直接计算出分子在 POM 中的坐标,研究人员根据这些坐标编制出了大约 50 万种潜在的气味。
这个数量远远超出了目前气味目录所涵盖的空间(约 5000 种可购买的、有特征的气味物质)。而收集这些用于训练模型的分子样本,需要训练有素的人类小组成员,通过嗅觉测试花费大约 70 人一年的时间才能完成。
咱就是说,以前人类总是认为 AI 无法感知物理世界,这下嗅觉也被攻破了。
不过,虽然研究团队提出的模型能够重现气味感知类别的结构和关系,并超过了化学信息学基线。
然而,整个实验过程还是有些缺失。比如没有考虑气味浓度和新元素的分子,而且在使用映射图谱时需要注意气味杂质的影响,并定期重新训练模型以纳入新数据。
目前,通过神经网络深度学习算法来训练 AI,在视觉、听觉等方面都取得了不少进展,比如神经拟态系统在硬體层面上复制生物神经元组织。
比起繁复的视觉与听觉神经系统,生物的嗅觉系统简单许,气味信息仅由少数几层神经网络进行分析,没有过多层级与复杂的神经网络结构,按理说应该发展很快。
其实早在 2009 年,英国斯科塞斯大学的研究团队就搭建了一种基于昆虫的嗅觉的模型,用来识别气味。但相较计算机视觉技术、自然语言处理技术等,当前的应用范围还是比较小。
就像一般人对气体检测与环境分析的需求不高,传统的气味传感器就已可以满足日常生活使用。
长按添加「智涌」小助手入群, 备注:公司 + 职务