大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现,CEO皮猜也来站台了

2025-02-20 简体 HK SG TW

今天小编分享的科学经验:谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现,CEO皮猜也来站台了,欢迎阅读。

CEO 皮猜亲自站台,谷歌的最新研究狠狠火了——

为科学家群体推出 " 科研搭子 "AI co-scientist,一个能够利用高级推理综合大量文献、生成新颖假设,并提出详细研究计划的多智能体 AI 系统。

划重点,该系统将与 OpenAI o1/DeepSeek-R1 相似的测试时间计算用来加速科学发现。

据皮猜介绍,这个系统已经在肝脏纤维化治疗、抗菌耐药性和药物再利用等重要研究领網域取得了初步成果。

而且趁热打铁,谷歌这次还面向全球科学家推出了一个 " 可信测试计划 ",大家现在都可以申请。

另外,从致谢名单可以看到,这项研究集齐了谷歌内部豪华阵容,包括 Google Research、Deepmind 以及 Cloud AI teams,还有顶尖高校科学家参与测试……

正如网友所言,说不定 AI 智能体未来某天就获得诺贝尔奖了。

文献综述 / 提出假设 / 报告一条龙搞定

直接来看AI co-scientist 的运作过程。

其目标非常清晰,当科学家文字给出研究主题后,它会借助多个 AI 智能体帮助生成新的研究假设、详细的研究概述和实验方案。

参与其中的智能体包括但不限于:

生成(Generation):提出新的假设或想法

反思(Reflection):评估和分析生成的假设

排名(Ranking):对假设进行优先级排序

进化(Evolution):通过迭代改进假设

邻近性(Proximity):探索与现有知识相近或相关的领網域

元审查(Meta-review):对整个过程进行监督和优化

这些智能体通过自动化反馈不断迭代,生成、评估和改进假设,从而形成自我优化循环,最终输出高质量研究方案。

而作为科学家,具体可以通过以下几种方式参与协作。

比如最开始给系统提供粗略的想法或一些研究主题 or 方向,让它帮你进一步细化;或者对 AI 的输出提供自然语言反馈,让它进一步调整。

此外,科学家还能使用其他工具,如网络搜索或一些专业领網域的 AI 模型,来进一步提高研究质量。

深挖二者具体协作过程,还能看到当科学家提出研究目标后,有一个监督智能体(Supervisor Agent)来负责工作分配。

专业智能体(红色框,具有独特的角色和逻辑);

科学家的输入和反馈(蓝色框);

系统信息流(深灰色箭头);

智能体间的反馈(智能体内部的红色箭头)。

从上面可以看出,整个 AI co-scientist 系统的运作较为简单。

测试时间计算用于科学发现

当然,这项研究的主要亮点是:

扩展测试时间计算(test-time)来大大增强其推理能力,包括上面提到的自我对弈、假设排名和进化过程等关键推理步骤。

在研究中,AI co-scientist 利用Elo 评级系统来衡量和提升其在解决科学问题方面的能力。

具体而言,Elo 评级是一个动态的评估指标,通常用于衡量比赛者的相对技能水平。研究人员对比了 AI co-scientist(蓝色线)和 Gemini 2.0(红色线)在 GPQA(General Problem-solving Question Answering)基准测试上的平均准确率。

结果发现,高 Elo 评级的系统在解决挑战性问题时,能够提供更准确答案。(正相关)

这表明了,Elo 评级可以作为一个有效的指标,用来预测和提升 AI co-scientist 在科学问题解决方面的性能。

接下来,七位领網域专家精选了 15 个开放的研究目标,并提出了相应的最佳解决方案。

目标是,利用自动化的 Elo 评估指标,来对比 AI co-scientist 和其他最先进智能体和推理模型(Gemini 2.0 Pro 版本和推理版本,以及人类专家)在解决这些复杂问题上的表现。

结果显示,AI co-scientist 明显表现最佳。

此外,随着 AI 系统投入更多时间进行推理和改进,其自我评估的质量得到了显著提升,甚至超出了传统模型以及在某些情况下无法解决问题的人类专家的水平。

更关键的,基于对 11 个研究目标子集的分析,专家评估认为 AI co-scientist 在新颖性和影响力方面的表现优于其他基线模型。

为了进一步评估 AI co-scientist 用于科学发现的实际潜力,研究团队进行了一系列端到端的实验室实验。

这些实验专注于三个关键的生物医学领網域:药物再利用、新治疗靶点的提出以及抗菌耐药性的背后机制。

实验中,AI co-scientist 不仅受到了专家的指导和反馈,而且涵盖了从简单到复杂的多种研究场景。

话不多说,我们具体来看其取得的初步成果。

首先,药物再利用是一种将已经批准用于其他疾病的药物用于治疗新疾病的策略。这种方法能够缩短药物开发的时间和成本,并且可以快速地将有效的治疗方案带给患者。

这一次,研究人员将目光瞄准了急性髓系白血病(AML),AI co-scientist 通过分析大量的生物医学数据,包括药物的化学结构、药效学和遗传信息,来预测哪些现有药物可能对 AML 有效。

最终,AI co-scientist 提出了 3 种可能药物。而且在进一步验证中,它所建议的药物在多个 AML 细胞系中,以临床相关的浓度抑制了肿瘤的活力,证明了其有效性。

而比药物再利用更复杂的识别新型治疗靶点中,研究人员聚焦于肝纤维化这种疾病。

肝纤维化的治疗是当前肝病研究的重点,而寻找有效的治疗靶点是关键。

过程中,AI co-scientist 通过对大量生物医学数据的分析,包括基因表达谱、蛋白质互作网络和已知药物数据库,来识别与肝纤维化相关的关键分子和生物学路径。

对比它所提出的一系列潜在治疗方案,和传统的纤维化诱导剂(作为阴性对照)以及抑制剂(作为阳性对照)来看,所有由 AI co-scientist 建议的药物都显示出有希望的活性(p 值小于 0.01)。

这意味着这些药物在治疗肝纤维化方面具有很高的可能性。

最后,在第三次实验中,通过分析大量的遗传学、蛋白质结构和药物活性数据,AI co-scientist 也被发现能够识别和预测细菌耐药的潜在机制。

具体而言,在囊膜形成噬菌体诱导的染色体岛(cf-PICIs)中,研究人员利用 AI co-scientist 的能力来探索 cf-PICIs 在多种细菌物种中的存在和功能机制。

AI co-scientist 通过分析和整合大量的生物学文献和数据,独立提出了一个新的假设:

cf-PICIs 可能通过与多种噬菌体尾部相互作用来扩大其宿主范围。

而这一假设得到了实验室实验的验证。

不过需要提醒,尽管 AI co-scientist 已经在科学发现上取得一系列初步成果,但谷歌也点出了其局限性:

文献综述能力、事实核查、与外部工具的交叉检查、自动评估技术以及更大规模的评估等,均需要进一步完善。

现在,感兴趣的研究人员 or 团队可以申请一波了 ~

申请地址:

https://docs.google.com/forms/d/e/1FAIpQLSdvw_8IPrc8O7ZM8FKF46i8BnOYMeSeyLeBNiuk_yGWIlnxYA/viewform

参考链接:

[ 1 ] https://x.com/sundarpichai/status/1892254274895184244

[ 2 ] https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他的速度跟不上现代篮球的节奏 王治郅:杨瀚森主要的问题是速度 他的速度跟 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击外国电影 逼好莱坞等回美拍片 贸易战烧进电影院:特朗普拟重税打击外国电影 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回旋镖:「折寿」换容量 手机电池突破8000mAh?硅碳技术的回旋镖:「折 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵权诉讼,后者回应称将严肃对待 任天堂对Genki提起Switch 2商标侵权诉讼,后 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人士:之前断网因流量欠费 哪吒汽车APP和官网恢复正常 知情人士:之前断 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌两家公司被列入经营异常 极越汽车 CEO 夏一平名下青岛/义乌两家公司 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商联合银行 全国经济第一大省明确,推动组建农商联合银行 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩更专注进球&更像C罗 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們