刷屏的Gemini“強大多模态能力”視頻，谷歌“造假”了？ - 大酷樂

今天小編分享的互聯網經驗：刷屏的Gemini“強大多模态能力”視頻，谷歌“造假”了？，歡迎閲讀。

周四，谷歌 YouTube 官方賬号發布的一個名為 " 與 Gemini 親密互動：與多模态 AI 互動 " 的視頻引發了網友圍觀，一天之内觀看次數達到 140 萬次。

這個視頻之所以能吸引這麼多目光，是因為它展示了谷歌史上最強 Gemini 多模态模型在互動方面令人印象深刻的表現。

在這段時長 6 分 22 秒的視頻中，Gemini 對輸入的語音、影像等提示做出了靈活、流暢的響應和理解，展現出強大的多模态理解和互動能力。

然而，據科技媒體 TechCrunch 最新報道，有用户仔細研究該視頻後，發現 Gemini 的驚豔表現幾乎都是 " 偽造 " 的。

視頻中 Gemini 對畫面的描述、對玩具識别和提問的回答等互動都是人為設定的，視頻跳過了部分提示以及模型的推理過程，給觀眾營造一種 Gemini 智能又敏捷的假象。

Gemini 可能沒有那麼智能

Gemini 在視頻中展示了多種互動技能，比如識别玩具鴨、跟蹤杯子戲法中的球、識别手勢、重排星球順序等。

比如，在第一個演示中，Gemini 識别了一個鴨子素描從一條線到完整畫面的演變過程。當演示者将鴨子素描填滿藍色顏料時，Gemini 指出鴨子通常是棕色、白色或黑色的，不會是藍色的。

然後，當 Gemini 看到一個藍色玩具鴨時，它驚訝地説道：" 這是什麼玩意！" 接下來它回答了關于這個玩具鴨的各種語音提問。

整段視頻中，Gemini 的反應都很快，回答縱享絲滑，但問題在于，它的反應不夠真實。

媒體通過捕捉素材來測試 Gemini 在各種場景下的反應能力，重新制作了一個演示視頻。然後，用視頻素材中的靜态畫面框提示 Gemini，并通過文字輸入進行提示。

結果顯示， Gemini 确實具備視頻中展示的某些能力，但并沒有真正如視頻所示的那樣快速、流暢地完成所有互動任務。

但據 TechCrunch 稱，視頻中展示的互動效果，其實并不是真實的即時互動，而是事先設定好的。

視頻用的是一系列特意準備的文本提示，以及配套的靜态圖片，通過挑選和剪裁這些預設素材，制作成真實互動的效果。

這樣做其實是為了誤導觀眾，讓人們相信視頻中展示的是 Gemini 真正的即時互動能力。但很可能的是，Gemini 在互動速度、準确性等方面均沒有視頻中展示的那樣強大。

視頻和文檔展示的提示，差别很大

值得注意的是，當 TechCrunch 對比視頻和谷歌發布的文檔演示時，發現兩者的提示存在差異。

比如，在視頻的 2 點 45 分處，一只手做出了一系列手勢，沒有配合語音提示。Gemini 很快回應道：" 我知道你在做什麼！你在玩石頭、剪刀、布！"

但谷歌的 Gemini 能力文檔一開始就明确指出，該模型不能通過識别單個手勢來推理，提示必須同時展示全部 3 個手勢，并給提示詞 " 這是什麼遊戲 "，只有這樣它才能識别出 " 石頭、剪刀、布 "。

所以視頻中的表現完全不符合文檔所述的提示限制，無法展示出 Gemini 的真正識别能力。

另外，Gemini 識别星球順序的場景也可能具有欺騙性。

演示者展示了貼有太陽、土星和地球塗鴉的便利貼，詢問 Gemini 行星順序是否正确，Gemini 給出了正确的太陽、地球、土星順序。

但文檔顯示真正的提示是，" 這是正确的順序嗎？思考離太陽的距離并解釋你的推理 "。

這兩種互動感覺上完全不同，視頻演示看起來像智能的及時評估，而在真正的互動中，Gemini 需要暗示性很強的提示。

另外，在追蹤杯子中紙團的演示中，也出現了不同于文檔記錄的提示的情況。

值得注意的是，如果一開始視頻就明确表示 " 這是對我們研究人員測試過的互動的藝術化呈現 "，大家都不會有異議，因為這類視頻本來就兼具事實和理想色彩。

但是這個視頻叫做 " 與 Gemini 親密互動 "，并标榜是 " 我們最喜歡的互動 "，這實際就是説，視頻中的互動就是真實互動的意思，但實際上并不是。

谷歌甚至沒有説明，視頻中展示的模型是已經上市的 Gemini Pro 版本，還是預計明年發布的 Gemini Ultra。

熱門排行

人力資源服務行業觀察：外包業務錨定8400萬新幸聽楓 | 2025-03-06
一口毒奶！韓軍KF-16雙機八彈誤炸民宅教堂，至寸飛蘭 | 2025-03-06
消失的“地标”：阿瑪尼傑尼亞撤離華貿，奢侈品習又夏 | 2025-03-06
還記得劉畊宏女兒小泡芙嗎，越來越漂亮啦！郜萌運 | 2025-03-06
堅守1元不漲價的中國造，制霸全球20年繁綺文 | 2025-03-06
比特币重回92000美元但市場情緒依然處于“ 謝飛揚 | 2025-03-06
廣汽昊鉑NDA4.0城市領航高階智駕正式公布，昊嬴覓晴 | 2025-03-06
字母哥談個人2萬分：無法想象杜蘭特3萬分詹甄正浩 | 2025-03-06
沒等到《美人魚2》，卻等來了《女足》，你還欠賁芳蕤 | 2025-03-06
太冤了！罐頭真不是“垃圾食品”，居然一直被誤繁綺文 | 2025-03-06
高露現身上海虹橋機場黑色外套點綴亮色愛惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：處理器更新為天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懶癌”發病率上升，定期體檢别忽視幸聽楓 | 2023-05-02
宋慧喬獲百想視後韓素希發圖手動加愛心表賁芳蕤 | 2023-05-02
十年了，他們終于要HE！惠惠君 | 2023-05-07
曹操墓，裏面都有啥？衛青柏 | 2023-05-02
中央部署經濟工作，釋放5大信号郜萌運 | 2023-05-02
陳自瑤抱病為愛女做蛋糕慶生，王浩信點贊沒露賁芳蕤 | 2023-05-02
高德上線手機彎道會車預警功能習又夏 | 2023-05-02
高端國產車：軍車血統，目前電動車越野的“天花謝飛揚 | 2023-05-02
等比例長大的童星，李蘭迪算一個郟君昊 | 2023-05-02
這些被抓來做實驗的流浪狗，最終拯救了無數糖集玲琳 | 2023-05-02
《雲襄傳》終于抬上來啦，男O女A讓人好上頭！集玲琳 | 2023-05-02
信用風險釋放趨緩，結構性風險需重點關注 — 袁曼雁 | 2023-05-02
21家A股遊戲公司2022年收入651億今年“遊衛青柏 | 2023-05-04
與周立波夫婦鬧糾紛成老賴，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
普京籤署總統令，批準對俄刑法典相關法條的修集玲琳 | 2023-05-02
中銀證券給予南京銀行增持評級袁曼雁 | 2023-05-03
解除資格！停止一切合作佼昌翰 | 2023-05-02
前董事長被免，天山生物全面進入“中植系”時惠惠君 | 2023-05-02
3699起聯想小新mini主機上架 13代酷睿标壓習又夏 | 2023-05-05
瘋成這樣，怎麼還能被全網吹捧？郜萌運 | 2023-05-02
狂吼11次“讓一下”！交警咆哮開道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收購美國第一共和銀行謝飛揚 | 2023-05-02
台劇赢麻了，又來一部8.9 衛青柏 | 2023-05-02
下降45分，上漲35分！34所自劃線院校復試分數線袁曼雁 | 2023-05-07
事關農村土地承包和農民權益，《農村土地承包郟君昊 | 2023-05-02
"三高"已盯上青少年，做好這件事是關鍵習又夏 | 2023-05-05
五一檔沒一個能打的集玲琳 | 2023-05-05
恐怖韓劇下神壇，這次膽小可入袁曼雁 | 2023-05-05
這劇是不是用ChatGPT寫的呀？惠惠君 | 2023-05-02
性騷擾慣犯，滾出娛樂圈謝飛揚 | 2023-05-05
48歲何炅自曝已老花眼，黃磊睡前認老，《向往的佼昌翰 | 2023-05-02
200户連夜疏散，原因讓人憤怒！“損失超一億”，袁曼雁 | 2023-05-03
一個《長月燼明》倒了，《狐妖》《長相思》《惠惠君 | 2023-05-02
當年輕人開始不随份子錢袁曼雁 | 2023-05-02
張天愛假期曬“酷”存照卷發披肩穿黑色吊嬴覓晴 | 2023-05-02
畢滢用8年時間成功逼宮？曾被傳已婚生子的她，幸聽楓 | 2023-05-03
宋慧喬獲視後首次曬照，拿獎杯笑容温柔郜萌運 | 2023-05-02