今天小編分享的科技經驗:谷歌 Gemini 1.5 炸場:能處理1小時視頻、11小時音頻,歡迎閲讀。
IT 之家 2 月 16 日消息,谷歌近日發布新聞稿,宣布推出全新的 Gemini 1.5 AI 模型,标志着該公司的人工智能技術取得了重大飛躍。
谷歌表示相比較前代產品 Gemini 1.0 Ultra,1.5 新模型在多個方面都取得了長足進步,能夠更高效、更長時間地處理信息。
Alphabet 與 Google 公司首席執行官孫達爾・皮柴(Sundar Pichai)表示:
我們上周推出了功能強大的 Gemini 1.0 Ultra 模型,并從 Gemini Advanced 開始,讓谷歌產品在實用性上邁上新台階。
開發者和雲計算客户今天開始可以使用 1.0 Ultra 開始構建,在 AI Studio 和 Vertex AI 中使用我們的 Gemini API。
在推出 Gemini 1.5 的同時,谷歌繼續将安全性和人工智能模型的快速發展放在首位。根據皮查伊的説法,Gemini 1.5 Pro 可達到與 1.0 Ultra 模型相當的質量,同時使用更少的計算能力,因此效率更高。
Gemini 1.5 Pro 可以處理 128000 個代币的标準情境視窗,但僅限特定開發人員和企業客户使用的版本可以處理多達 100 萬個代币。
能處理 100633 行代碼中問題
這意味着什麼?谷歌表示:"1.5 Pro 可以一次性處理大量信息,包括 1 小時的視頻、11 小時的音頻、超過 3 萬行代碼的代碼庫或超過 70 萬字的文字。在我們的研究中,我們還成功測試了多達 1000 萬個标記。"
Gemini 1.5 Pro 正在檢查阿波羅 11 号登月任務中長達 402 頁的 PDF 文稿。谷歌甚至給出了一張靴子即将踏下的簡短圖畫,它就能回答這是尼爾・阿姆斯特朗(Neil Armstrong)登月的相關信息。
能處理 402 頁的 PDF 文檔
下面是 Gemini 1.5 Pro 處理巴斯特 - 基頓(Buster Keaton)44 分鍾無聲電影(696,000 個代币)的情況,它能夠分析情節點和其他事件以提及時間碼,甚至還能回答多種模式的提示(例如提供一個簡短的草圖并詢問場景是什麼):
能處理 44 分鍾長的視頻
IT 之家附上報告原文地址,感興趣的用户可以深入閲讀。