原生多模态AI大模型或更适合教育，谷歌稱Gemini數學、物理等方面超越人類專家

今天小編分享的教育經驗：原生多模态AI大模型或更适合教育，谷歌稱Gemini數學、物理等方面超越人類專家，歡迎閲讀。

谷歌 Gemini 的出現或将打破現有大模型格局。

來源|多知網

作者 |王上

圖片來源 |Gemini

12 月 6 日，谷歌宣布将推出其認為規模最大、功能最強大的人工智能模型 Gemini ( 雙子座 ) ，試圖超越 OpenAI。尤其是 Gemini 的演示視頻在全網刷屏，引發熱議。不過，評論兩極分化。

即便如此，谷歌母公司 Alphabet 股價周四大漲超過 5%，報收每股 136.93 美元。

谷歌首席執行官桑達爾 · 皮查伊 ( Sundar Pichai ) 在一份新聞稿中表示：" 這是令人難以置信的勢頭，然而，我們才剛剛開始觸及可能性的表面。這個新時代的模型代表了我們作為一家公司所做出的科學努力之一。"

谷歌 DeepMind 產品副總裁 Eli Collins 在新聞發布會上表示，這是第一個在解決數學、物理、歷史、法律、醫學和倫理等某些基準方面超越人類專家的人工智能模型。

谷歌稱 Gemini 是多模态的，即可以同時識别視頻、影像、文本和語音。不過， Gemini 暫時只會以文本、語音或代碼形式回復。

根據視頻演示，Gemini 與 ChatGPT 最大的不同是，可以在線上和線下進行多模态的互動。在此之前，各大模型的多模态并未完全實現。

DeepMind 創始人、Google DeepMind 首席執行官 Demis Hassabis 接受《連線》雜志采訪時提到，Gemin 是 " 原生多模态 "，而其他大模型是 " 近似多模态 "。意思是 "Gemini 從一開始就是多模态的訓練，而其他模型是視頻、影像、文本和語音等單獨的模型，然後拼裝到一起。"

在視頻演示中，工作人員在紙上畫了一只藍色的鴨子，Gemini 馬上能識别出是一只鴨子，但它很快説這只鴨子的顏色不真實，然後，它還給出了 " 鴨子 " 在全球的不同發音，包含英語、法語、中文等語言的發音。Gemini 還展示了在杯子轉換遊戲中追蹤球，識别手影戲手勢，重新排列行星素描等。

如果 Gemini 能實現多模态互動，那麼對教育來説将極為便利。比如讓 Gemini 識别數學作業，它能説出對錯，相當于及時批改，也能對數學題目進行講解。

在一個視頻演示中，谷歌展示了如何使用 Gemini 來幫助完成物理作業，逐步解決工作表上的問題，并指出已填寫答案中可能存在的錯誤。

不過，根據美國科技媒體 TechCrunch 今天的報道，稱 Gemini 的演示有剪輯的成分，作者認為 Gemini 的反應速度太快了。對此，谷歌回應稱，" 這個視頻展示了 Gemini 的真實輸出，但我們對演示進行了一些剪輯。"

也就説，谷歌演示了 Gemini 的技術和未來趨勢，但是，目前，Gemini 的使用體驗暫時還沒有視頻展示的那麼流暢。

根據谷歌介紹，Gemini 将包括三種不同的套件：

1）Gemini Ultra，功能最強大，适用于高度復雜的任務。

2）Gemini Pro，适用于多種任務。

3）Gemini Nano，适合想要構建 Gemini 支持的應用程式的 Android ( 安卓 ) 用户。例如，借助 Gemini Nano，人們現在可以總結使用 Pixel 8 Pro 手機上的錄音機應用程式進行的錄音（但僅限英語）。

Eli Collins 強調，在 30 項衡量影像理解或數學推理等能力的基準測試中，Gemini Ultra 性能 " 遠遠超過 " 其他最先進的模型。

當前，谷歌正在分階段推出 Gemini，谷歌的人工智能聊天機器人 Bard 已經開始使用 Gemini Pro 的微調版本，為聊天機器人有了更先進的推理和理解能力以及其他功能。Gemini Pro 支持的 Bard 僅提供英語版本，在 170 多個國家 / 地區可用。谷歌表示，巴德将于明年與 Gemini Ultra 整合。在接下來的幾個月中，該公司将在其他應用程式中添加 Gemini，包括搜索、Google Ads 和 Chrome 浏覽器。

谷歌 Bard 的副總裁 Sissie Hsiao 在新聞發布會上表示，Gemini Pro 在 8 個行業基準測試中的 6 個中優于 GPT-3.5 。Google 最先進的模型 Gemini Ultra 在八項基準測試中的七項中擊敗了較新的 GPT-4。

不過值得警惕的是，大模型有一個問題是會產生幻覺，指的是一些人工智能模型在面對某些輸入時，會生成不準确、不完整或誤導性的輸出。Gemini 可以避免這個問題嗎？谷歌 DeepMind 產品副總裁 Eli Collins 在新聞發布會上説：" 大模型仍然會產生幻覺。"

一年前，OpenAI 發布 ChatGPT 後，科技巨頭們紛紛推出自己的聊天機器人和大模型，以與這家人工智能初創公司競争。谷歌最近對 Gemini 的評估表明 OpenAI 的競争對手正在迎頭趕上。

可以看到，全球大模型軍備競賽愈演愈烈。谷歌 Gemini 的出現或将打破現有大模型格局。

相關閲讀：

基于大模型，谷歌搜索上線口語陪練功能

有了語音和影像功能後，ChatGPT 将能批改作業了、講故事了！

星火大模型 V3.0: 可以輔導學習，可以心理咨詢，家庭陪伴機器人也同步上線

MathGPT 大模型發布：落地學而思 AI 學習機

評測 | 和有道虛拟人 Echo 狂飙英語後，上頭了

作業幫大模型命名 " 銀河 "，将落地智能硬體

李彥宏：文心一言對标 ChatGPT？門檻很高！