今天小编分享的科学经验:谷歌版o1突发即屠榜!思考速度比所有模型快5倍,能解摩斯代码,数学物理秒秒钟解决,欢迎阅读。
谷歌版 o1 来了!在奥特曼 " 双十二 " 倒数第二天——
他们发布Gemini 2.0 Flash Thinking,顾名思义,以闪电般的速度解决复杂问题并展示其思考过程的实验模型。
从姐夫哥展示出的 Demo 来看,它能在几秒钟之内解决一个物理问题,并且给出思考过程。
还可以给一张图,同时涉及视觉和文本线索的谜题。
如何用其中三个数字加起来等于 30?
结果同样也是短短几秒,思考了好几种方案,最终确定是需要将 9 号球翻转为 6 号球,以实现 6+13+11 等于 30 这样一个结果。
所有综合类别指标中显示,目前 Gemini 2.0 Flash Thinking 排名第一,包括数学、代码、指令跟随、长 QA、创意写作等等各方面。
目前在谷歌 AI Studio 就可以免费使用。
从众多网友实测中,主要分为两大 " 派系 ",一种是纯文本型,另一种是视觉类谜题。
最明显感知的就是一个快字。
它还可以解决像抛硬币这样的概率问题:如果我一直抛硬币,直到得到 HHH 或 HTH,那么得到这两个几率之比是多少?
甚至它还可以解析摩斯代码,让网友直呼:怪吓人的。
有解决这种视觉类谜题的,比如找出这里面的字母和数字,并且说明出现了多少次。
结果它都一一指出来了。
DeepMind 首席科学家拿出了他当年面试时遇到第一个问题,是用笔和纸写下的一道关于数论的问题。
结果它也秒秒钟回答了出来。
目前仅支持 32k 上下文視窗,也不支持联网。不过主创表示接下来会在新的一年里快速跟进,提供更长的 token、更多的工具支持等。
今天之所以推出这个实验版,主要是为了接受大家的反馈意见。
也有网友反馈,它没有考虑到一些关键的物理因素。
△没有考虑到河流流动所暗示的海拔
不过也有不少网友反应,有个 bug 是,它似乎还是搞不清楚 Strawberry 有多少个 r。
但如果进一步「仔细思考一下」,它就能回答出来。
姐夫哥还透露,未来还会有更多功能,可以在这里期待一下子。
好了,感兴趣的小伙伴可以前往去试试。
体验链接:
https://aistudio.google.com/prompts/new_chat
参考链接:
[ 1 ] https://x.com/OfficialLoganK/status/1869789820308074837
[ 2 ] https://x.com/JeffDean/status/1869789813232341267
[ 3 ] https://x.com/lmarena_ai/status/1869793847548817563
[ 4 ] https://x.com/drjwrae/status/1869806621024772096/video/2
[ 5 ] https://x.com/catebligh/status/1869823074809647589
— 完 —
点这里关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
>