今天小编分享的科学经验:Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能,欢迎阅读。
谷歌の" 反击 " 来了!
Gemini 被 Sora 抢走的风头,现在有抢回来的势头了。
在最新实测中,Gemini 1.5 能分析 Sora 视频是否 AI 生成。
是直接给出当中关键因素的那种。
比如这个经典的猫猫视频,Gemini 1.5 直言:
它的眼睛和毛都看起来都不像是真的。
还有像这段生成视频,Gemini 1.5 都能说出个一二三造假细节来 ~
都说魔法打败魔法,结果 Sora 发布这才没几天,就火速被 Gemini 1.5" 抓出现行 "。
对于 Gemini 1.5 第一波实测结果,网友直呼:that ’ s scary good,并称其为 " 游戏规则的改变者 "。
Gemini 1.5 第一波实测来了
Gemini 1.5 版本突然发布,结果被对面 Sora 的光芒所掩盖。
但即便如此,其模型性能的重大更新,尤其是支持 100 万 token 上下文視窗,仍让网友们印象深刻。
现在一些博主陆陆续续地拿到了访问资格,开始了第一波实测。
除了能鉴别生成视频真假之外,还有这些令人印象深刻的功能。
1、分解并理解长视频。
比如一场 14 分钟的 NBA 扣篮视频,Gemini 1.5 能判断出哪个扣篮得分最高, 并给出其中扣篮细节。
整个响应过程大致只需要 55 秒左右。
2、理解长文本内容,进行比较分析。
博主投喂了《星际穿越》和《星际探索》两个完整的电影脚本,合起来接近 10 万 tokens,要求 Gemini 1.5 分析比较,以帮助决定观看哪部电影为好。
结果只需三十几秒,就给出了完整详尽的分析报告。
这样一看,分析其中的剧情台词也就显得小儿科了。
(分析电影中最鼓舞人心的三句话)
3、翻译小语种。
即便是那种只有 2000 人左右使用的语言也能搞定,比如将英语翻译成萨特兰语。
除此之外,还有像分析理解论文中表格的细节。
对于这波实测,网友们都表示惊叹:这是个巨大进步,想说可能得等 GPT-5 来对抗。
尤其是能处理 100 万 Tokens 上下文,这对 GenAI 初创公司很有用。
还有网友好奇谷歌是怎么解决上下文視窗大小问题的?
一定是发现或实现了什么新东西。
网友:不太可能是巧合
不过对于谷歌这波 " 反击 ",暂且还未有 OpenAI 的人出来回应。而此前 Sora 的发布,也少见有谷歌的人出来评价。
但两家同一天发布,早就有网友浮想联翩:
确实不太可能是巧合。
奥特曼不想失去谷歌这样一个绝妙的炒作时机。
有网友认为,Sora 宣布显然是一种营销举措,它还没有准备好。相比而言,Gemini 1.5 才是真正的突破。
但也有人认为,Sora 才真正意想不到。
Gemini 1.5 非常棒,但并不令人惊讶。
我非常有信心 OpenAI 内部也有超过 100 万个模型。(Sora 是一个副项目)。
并且认为 GPT-5 出来之后,会击败所有的竞争对手。
对于两家这样的操作,你怎么看呢?
One More Thing
两家激战,受伤的是 Adobe 这类聚光灯之外的玩家。
这两天股价简直是一跌再跌……
而此前备受关注的视频生成公司 Runway,其联合创始人回应:游戏开始了。
值得一提的是,此次国内反应跟 ChatGPT 那时候有点不一样。
Sora 出来之后,少见喊对标的人,比当时要安静多了…
参考链接:
https://twitter.com/rowancheung/status/1759280384930459941