今天小編分享的教育經驗:原生多模态AI大模型或更适合教育,谷歌稱Gemini數學、物理等方面超越人類專家,歡迎閲讀。
谷歌 Gemini 的出現或将打破現有大模型格局。
來源|多知網
作者 |王上
圖片來源 |Gemini
12 月 6 日,谷歌宣布将推出其認為規模最大、功能最強大的人工智能模型 Gemini ( 雙子座 ) ,試圖超越 OpenAI。尤其是 Gemini 的演示視頻在全網刷屏,引發熱議。不過,評論兩極分化。
即便如此,谷歌母公司 Alphabet 股價周四大漲超過 5%,報收每股 136.93 美元。
谷歌首席執行官桑達爾 · 皮查伊 ( Sundar Pichai ) 在一份新聞稿中表示:" 這是令人難以置信的勢頭,然而,我們才剛剛開始觸及可能性的表面。這個新時代的模型代表了我們作為一家公司所做出的科學努力之一。"
谷歌 DeepMind 產品副總裁 Eli Collins 在新聞發布會上表示,這是第一個在解決數學、物理、歷史、法律、醫學和倫理等某些基準方面超越人類專家的人工智能模型。
谷歌稱 Gemini 是多模态的,即可以同時識别視頻、影像、文本和語音。不過, Gemini 暫時只會以文本、語音或代碼形式回復。
根據視頻演示,Gemini 與 ChatGPT 最大的不同是,可以在線上和線下進行多模态的互動。在此之前,各大模型的多模态并未完全實現。
DeepMind 創始人、Google DeepMind 首席執行官 Demis Hassabis 接受《連線》雜志采訪時提到,Gemin 是 " 原生多模态 ",而其他大模型是 " 近似多模态 "。意思是 "Gemini 從一開始就是多模态的訓練,而其他模型是視頻、影像、文本和語音等單獨的模型,然後拼裝到一起。"
在視頻演示中,工作人員在紙上畫了一只藍色的鴨子,Gemini 馬上能識别出是一只鴨子,但它很快説這只鴨子的顏色不真實,然後,它還給出了 " 鴨子 " 在全球的不同發音,包含英語、法語、中文等語言的發音。Gemini 還展示了在杯子轉換遊戲中追蹤球,識别手影戲手勢,重新排列行星素描等。
如果 Gemini 能實現多模态互動,那麼對教育來説将極為便利。比如讓 Gemini 識别數學作業,它能説出對錯,相當于及時批改,也能對數學題目進行講解。
在一個視頻演示中,谷歌展示了如何使用 Gemini 來幫助完成物理作業,逐步解決工作表上的問題,并指出已填寫答案中可能存在的錯誤。
不過,根據美國科技媒體 TechCrunch 今天的報道,稱 Gemini 的演示有剪輯的成分,作者認為 Gemini 的反應速度太快了。對此,谷歌回應稱," 這個視頻展示了 Gemini 的真實輸出,但我們對演示進行了一些剪輯。"
也就説,谷歌演示了 Gemini 的技術和未來趨勢,但是,目前,Gemini 的使用體驗暫時還沒有視頻展示的那麼流暢。
根據谷歌介紹,Gemini 将包括三種不同的套件:
1)Gemini Ultra,功能最強大,适用于高度復雜的任務。
2)Gemini Pro,适用于多種任務。
3)Gemini Nano,适合想要構建 Gemini 支持的應用程式的 Android ( 安卓 ) 用户。例如,借助 Gemini Nano,人們現在可以總結使用 Pixel 8 Pro 手機上的錄音機應用程式進行的錄音(但僅限英語)。
Eli Collins 強調,在 30 項衡量影像理解或數學推理等能力的基準測試中,Gemini Ultra 性能 " 遠遠超過 " 其他最先進的模型。
當前,谷歌正在分階段推出 Gemini,谷歌的人工智能聊天機器人 Bard 已經開始使用 Gemini Pro 的微調版本,為聊天機器人有了更先進的推理和理解能力以及其他功能。Gemini Pro 支持的 Bard 僅提供英語版本,在 170 多個國家 / 地區可用。谷歌表示,巴德将于明年與 Gemini Ultra 整合。在接下來的幾個月中,該公司将在其他應用程式中添加 Gemini,包括搜索、Google Ads 和 Chrome 浏覽器。
谷歌 Bard 的副總裁 Sissie Hsiao 在新聞發布會上表示,Gemini Pro 在 8 個行業基準測試中的 6 個中優于 GPT-3.5 。Google 最先進的模型 Gemini Ultra 在八項基準測試中的七項中擊敗了較新的 GPT-4。
不過值得警惕的是,大模型有一個問題是會產生幻覺,指的是一些人工智能模型在面對某些輸入時,會生成不準确、不完整或誤導性的輸出。Gemini 可以避免這個問題嗎?谷歌 DeepMind 產品副總裁 Eli Collins 在新聞發布會上説:" 大模型仍然會產生幻覺。"
一年前,OpenAI 發布 ChatGPT 後,科技巨頭們紛紛推出自己的聊天機器人和大模型,以與這家人工智能初創公司競争。谷歌最近對 Gemini 的評估表明 OpenAI 的競争對手正在迎頭趕上。
可以看到,全球大模型軍備競賽愈演愈烈。谷歌 Gemini 的出現或将打破現有大模型格局。
相關閲讀:
有了語音和影像功能後,ChatGPT 将能批改作業了、講故事了!
星火大模型 V3.0: 可以輔導學習,可以心理咨詢,家庭陪伴機器人也同步上線
阿裏大模型正式發布,張勇:" 所有軟體都值得接入大模型更新改造 "