大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 互聯網

谷歌深夜發布全球最強開源大模型Gemma,性能“吊打”130億的Llama

2024-02-22 简体 HK SG TW

今天小編分享的互聯網經驗:谷歌深夜發布全球最強開源大模型Gemma,性能“吊打”130億的Llama,歡迎閲讀。

就在剛剛,谷歌扔下 " 震撼彈 "。

北京時間 2 月 21 日晚 21 點,美國科技巨頭谷歌(Google)宣布推出全球性能最強大、輕量級的開源模型系列 Gemma,分為 2B(20 億參數)和 7B(70 億)兩種尺寸版本,2B 版本甚至可直接在筆記型電腦上運行。

谷歌表示,Gemma 采用與 Gemini 模型相同的研究和技術,由 Google DeepMind 和谷歌其他團隊開發,專為負責任的 AI 開發而打造。谷歌聲稱,Gemma 模型 18 個語言理解、推理、數學等關鍵基準測試中,有 11 個測試分數超越了 Meta Llama-2 等更大參數的開源模型。

平均分數方面,Gemma -7B 的基準測試平均分高達 56.4,遠超過 Llama-13B(52.2)、Mistral-7B(54.0),成為目前全球最強大的開源模型。

請輸入圖説

谷歌和 Alphabet 公司 CEO 桑達爾 · 皮查伊(Sundar Pichai)表示,Gemma 展示了強大的性能,從今天開始,該模型将在全球範圍内提供,并可在筆記型電腦、工作站或谷歌雲上運行。

Google DeepMind CEO Demis Hassabis 表示,輕量開源的 Gemma 是同類尺寸中性能最佳的模型。

如今,谷歌不僅将對手瞄向 OpenAI,而且打算占據一切,新模型将比扎克伯格的 Llama-2" 遙遙領先 "。

性能超越 Llama-2 開源模型,谷歌 Gemma 為何那麼強?

自 Gemini 發布至今,谷歌持續在 AI 方面 " 狂飙 "。

2023 年 12 月,谷歌推出全球最強大、最通用的多模态通用大模型:Gemini,中文稱 " 雙子座 ",共包括三個不同尺寸版本:Ultra(超大杯)、Pro(大杯)和 Nano(中杯),全面内置最新、最強大的自研 AI 超算芯片 Cloud TPU v5p。

谷歌表示,在六項基準測試中,Gemini Pro 性能表現優于 GPT-3.5;而在 30 項性能基準測試中,Gemini Ultra 超越了目前最強模型 GPT-4,甚至在數學、物理、法律等 57 個領網域測試中成為全球第一個超越人類專家水平的 AI 模型。

如此強大的 AI 技術,谷歌必然要持續推進。

所以,谷歌不僅統一了 AI 人才和算力資源,而且全力投資 Gemini。今年 1 月,谷歌宣布全球一項大模型基準測試中 Gemini 超越 GPT-4;2 月,谷歌宣布對标 ChatGPT 的 AI 聊天機器人平台 Google Bard 更名為 Gemini,并推出安卓版本的獨立 App,以及發布史上性能和功能最強大的 Gemini Ultra 1.0 模型等。

然而,2 月中旬 Gemini 1.5 發布的同時,OpenAI 全新視頻生成模型 Sora 突然亮相,一經面世瞬間成為頂流,話題熱度只增不減。所有人都在讨論 Sora 為行業帶來的改變,但這讓谷歌在 AI 領網域的努力一下子 " 黯然失色 "。

僅過了不到半個月,如今,谷歌卷土重來,正式推出全球最強大的開源模型 Gemma。

相比 ChaGPT 和 Gemini,Gemma 可能更适合較小規模的任務,例如簡單的 AI 聊天或摘要。

谷歌表示,Gemma 其靈感來自于此前谷歌發布的 Gemini 大模型,名字在拉丁語中意為 " 寶石 "。

具體來説,谷歌此次主要展示 Gemma 模型架構、性能表現、自研芯片、訓練基礎設施、軟體工具、碳減排、安全和評估、負責任等多個方面的努力。

其中,模型架構方面,Gemma 基于谷歌 Gemini 模型以及 Transformer 自注意力機制的深度學習技術研發,Gemma 2B 和 7B 分别針對來自網絡文檔、數學和代碼的 2T 和 6T 規模英文标注數據進行訓練。與 Gemini 不同,這些模型不是多模式的,也沒有針對多語言任務的最先進性能進行訓練。

不僅如此,Gemma 還使用了改進後的多頭注意力、RoPE 嵌入、GeGLU 激活函數等新的技術,旨在文本領網域實現通用能力,同時具備最先進的理解和推理技能。

性能表現方面,根據技術檔案,Gemma 在 MMLU、MBPP 等 18 個基準測試中,有 11 個測試結果超越了 Llama-13B 或 Mistral-7B 等模型。

自研芯片方面,谷歌 Gemma 使用自研 AI 加速芯片 TPUv5e 進行訓練。其中 7B 模型在 16 個 Pods 上訓練,2B 模型在 2 個 Pods 上訓練,每個 Pod 可占用的 256 個芯片更少,v5e 經過優化,可以成為轉換器、文本到影像和卷積神經網絡 ( CNN ) 訓練、微調和服務的最大價值產品。

而通過 TPUv5e,Gemma 模型可在文本領網域實現強大的通用能力,同時具備最先進的理解和推理技能。

值得一提的是,谷歌今天還宣布與英偉達(NVIDIA)展開合作。這意味着,Gemma 不止使用 TPUv5e 芯片,而且使用 NVIDIA GPU 來優化 Gemma 模型。

軟體工具層面,谷歌發布了全新 AI 軟體工具包,名為 Responsible Generative AI Toolkit,從而幫助開發者和研究人員優先構建安全和負責任的 AI 應用。此外,Gemma 提供 Keras 3.0、原生 PyTorch、JAX 和 Hugging Face Transformers 多個框架工具,并支持基于 Google Cloud 的優化,以及在筆記型電腦、台式機、物聯網、移動設備和雲端等多個跨設備中兼容,從而讓 Gemma 實現推理和微調。

除了上述提及的層面,谷歌還在碳減排、安全和評估、負責任等方面有新的進展。其中,預訓練 Gemma 模型的碳排放量大大減少,約為 131000 噸二氧化碳;同時 Gemma 使用過濾後的預訓練數據集,以減少不安全内容的風險;以及通過監督式微調和基于人類反饋的強化學習(RLHF)進行微調。

谷歌表示,在人類偏好評估中,Gemma 在遵循指令和基本安全協定方面的表現優于 Mistral v0.2 7B Instruct 模型。

另外,Google DeepMind 采取結構化的方法來确保模型的負責任開發和部署,包括評估潛在的社會影響。

谷歌 DeepMind 產品管理總監 Tris Warkentin 表示,由于擔心開放模型存在部分風險,該公司 " 對 Gemma 進行了更廣泛的紅隊(專家、開發者等内部對抗性測試的外部團隊)",從而提前挖掘出了更多 AI 系統存在的缺陷和風險。

署名研究人員高達 57 人,其中 31 人來自亞洲

技術論文顯示,此次參與谷歌 Gemma 開源模型的研發人員數量高達 57 位。

其中包括核心貢獻者(Core Contributors)14 人,參與者(Contributors)達 35 人,產品管理(Product Management)2 人,項目管理(Program Management)1 人,執行贊助人(Executive Sponsors)5 人。此外,谷歌還對内部其他多個團隊進行感謝。

據钛媒體 AGI 通過 Kimi Chat 提供的信息、研發者名字進行梳理和猜測,此次參與 Gemma 模型研發的 57 人中,可能有大約一半以上(31 人)的開發者來自亞洲,或與華人或具有華人血統的個人有關。

例如,谷歌 Gemma 團隊當中的 Le Hou(侯樂)博士,曾是谷歌 FLAN-T5 技術的作者。

在加入谷歌之前,侯樂在紐約州立大學石溪分校獲得了博士學位。博士在讀期間,他專注于分析高分辨率影像,如衞星和醫學影像。

侯樂在谷歌的研究主要集中于 NLP 方面,包括高效的語言模型訓練、指令微調和提示工程等,核心能力是通過更好的微調和提示工程來提高最先進語言模型的推理能力。

而谷歌 Gemma 團隊另一位華人 Geng Yan,也是 AI 領網域大神級人物。他畢業于浙江大學計算機科學系,随後在美國美國卡内基梅隆大學完成計算機視覺專業的碩士學位。

Geng   Yan 曾在商湯、亞馬遜等公司任職過,主要研究 AI 機器算法技術,曾在谷歌參與研發 Google Facemesh 追蹤面部的 AI 模型,在谷歌相機自拍、手機支付等多個場景中發揮更大作用。

事實上,據 The Information 報道稱,目前谷歌公布的最新論文中,Gemini 的研發團隊超過 800 人。因此,參與 Gemma 研發人員占比可能只有 Gemini 團隊的 7.1%。

人員少,但 Gemma 性能毫不遜色。

然而,谷歌在技術報告中也坦言,盡管 Gemma 模型在性能、安全性和負責任開發方面實現了突飛猛進的進展,但谷歌承認 " 此發布是不可逆轉的 ",并且開放模型造成的危害尚未明确定義。谷歌仍需要進一步研究來創建可靠、按預期執行的穩健、安全的模型。

" 因此我們将繼續采取與這些模型的潛在風險相稱的評估和安全緩解措施。" 谷歌表示,Gemma 在 6 個安全基準以及人類并行評估方面均優于競争對手。

Warkentin 表示,Gemma 模型目前先适配了英語這一廣泛語言,但他也指出,未來谷歌團隊也 " 希望能夠與社區共同努力,滿足英語任務之外的市場需求。"

目前,開發者可以在 Kaggle 中免費使用 Gemma,首次使用 Google Cloud 的用户将獲得 300   美元的積分,并可申請高達 50   萬美元的 Google Cloud 積分來使用這些模型。具體可通過 ai.google.dev/gemma 進行查詢。

另外,谷歌方面今晨還宣布,Google One AI Premium 正在将 Gemini 整合到谷歌 Gmail、Docs、Sheets、Slides 和 Meet 當中,提供書寫、校對和生成影像等 AI 增強功能。而作為賬户付費產品,前兩個月免費使用,之後每月 19.99 美元。

小結:谷歌拼命 " 卷 ",只想成為王者

三個月發布三款大模型系列,谷歌 AI   技術產品的更新迭代之快,讓人始料未及。

OpenAI CEO 奧爾特曼(Sam Altman)曾私下表示,與谷歌相比,OpenAI 在算力上處于劣勢。

在 AI 三要素中,谷歌在算力、算法、數據方面都具有很明顯的技術領先優勢。那麼如今,谷歌連續發布 Gemini、Gemma 模型,覆蓋開源和閉源方向,希望成為 "AI 行業王者 " 的野心暴露無遺。

我們預計,接下來 Gemma 将成為開源社區的關注焦點。

谷歌開發者 X 副總裁兼總經理、谷歌開發者關系主管 Jeanine Banks 認為,Gemma 模型 " 感覺像是谷歌從 TensorFlow 等工具開源 AI 開發技術的歷史的延續 " 的最新 AI 系統,從 PaLM2、AlphaFold 到 Gemini,最後形成了 Gemma。 

  " 我們認為,如果谷歌能夠成為 API 和開放模型的唯一提供商,為社區提供最廣泛的功能集,那就完美了。"Jeanine Banks 表示。

接下來,我們就看 " 剛剛跌落神壇 " 的開源模型 Meta Llama 如何再接招了。

(本文首發钛媒體 App,作者|林志佳)

熱門排行
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們