今天小編分享的互聯網經驗:小米大模型交成績單,歡迎閱讀。
來源:獵雲精選,文 / 王非
距 4 月 14 日雷軍官宣殺入大模型不到 4 個月,小米大模型終于首次曝光,并交出了一份初步成績單!
多方消息顯示,小米大模型 MiLM-6B 現身 C-Eval、CMMLU 大模型評測榜單。
根據 GitHub 項目頁給出的信息,MiLM-6B(下稱:小米大模型)是由小米開發的一個大規模預訓練語言模型,參數規模為 64 億。
相關頁面顯示,小米大模型在 C-Eval 榜單中排名第 9、同參數量級排名第 1,在 CMMLU 中文向大模型排名第 1。
值得一提的是,雷軍将于下周一(8 月 14 日)晚間的新品發布會上,發表年度演講。
本次演講以 " 成長 " 為主題,雷軍發布的微博透露," 當初做的一個決定,改變了我的一生。" 而且,這個決定讓他慶幸至今。
外界猜測,雷軍年度演講的内容,除了與小米造車相關,或許還将與小米籌備已久的大模型有關。
小米大模型取得雙 " 第一 ",下周一或亮相
C-Eval 榜單,全稱 C-Eval 全球大模型綜合性考試測試榜,是由清華大學、上海交通大學和愛丁堡大學合作構建的中文語言模型綜合性考試評估套件。
該套件覆蓋人文、社科、理工、其他專業四個大方向,包括 52 個學科,涵蓋微積分、線性代數等多個知識領網域。共有 13948 道中文知識和推理型題目,難度分為中學、本科、研究生、職業等四個考試級别,能夠更加全面的對模型的語言處理能力進行評估,對中文社區語言大模型的研發有着很好的參考價值。
具體而言,在 C-Eval 評估中,小米大模型的平均分為 60.2,在 STEM、社會科學、人文科學、其他這四個類别中,均取得了不錯的表現。
其中,在 STEM(科學、技術、工程和數學教育)全部 20 個科目中,小米大模型得分 54.5,在計量師、物理、化學、生物等多個項目中獲得了較高的準确率;在 10 個社會科學科目中,小米大模型得分 71.7,在教育學和地理外的所有科目中,獲得了較為理想的準确率;在 11 個人文科學科目中,小米大模型得分 62.7,在歷史與法律基礎上,獲得了不錯的準确率;在其他分類下,小米大模型則得分 57.7。
整體而言,小米大模型在法學、數學、編程、概率論、離散數學等科目上的表現,仍然有明顯進步空間。
CMMLU,則是由 MBZUAI、上海交通大學、微軟亞洲研究院合作完成的,一個全面的中文大模型基準。它涵蓋了 67 個主題,涉及自然科學、社會科學、工程、人文、以及常識等,可以全面地評估大模型在中文知識儲備和語言理解上的能力。
在 CMMLU 中文向大模型評估中,小米大模型在 zero-shot 和 five-shot 測試中的平均分分别為 60.37 和 57.17,表現出良好的知識和推理能力。
在 zero-shot 測試中,小米大模型在人文學科得分 63.49,社會科學得分 66.2,其他得分 62.14,中國特定主題得分 62.07,平均分為 60.37。
在 five-shot 測試中,小米大模型在人文學科得分 61.12,社會科學得分 61.68,其他得分 58.84,中國特定主題得分 59.39,平均分為 57.17。
小米大模型首次曝光于上述兩個評測榜單中,并取得 " 雙第一 " 的不錯成績,也為其接下來的亮相,帶來了充足底氣。
至于亮相的時間,或許就在下周一,小米舉辦的新品發布會中,雷軍的年度演講環節。
此前,雷軍曾表示," 今年的演講比前幾年更長些,演講之後是我們的年度新品發布,還會披露我們技術探索的新進展。今年内容也非常多,估計 3 小時左右。"
雷軍口中的 " 技術探索的新進展 ",除了小米汽車,可能就要數小米大模型了。
任命栾劍做領頭人,千人團隊百億研發護航
4 月 14 日,據澎湃新聞報道,小米集團發布内部郵件,任命栾劍擔任技術委員會 AI 實驗室大模型團隊負責人,向技術委員會副主席、AI 實驗室主任王斌匯報。
公開資料顯示,栾劍現任小米技術委員會 AI 實驗室語音生成團隊負責人,曾任東芝研究院研究員、微軟工程院高級語音科學家、微軟小冰首席語音科學家及語音團隊負責人等職位。
緊随其後,雷軍于 4 月 14 日晚間在微博發文,首度談及小米對大模型和 AIGC 的看法。
" 全力以赴、堅決擁抱 ",雷軍為小米大模型發展定調!他還透露,對于大模型,小米 " 正在研發一些有趣的技術和產品,等我們打磨好了,再給大家展示。"
雷軍在微博提及小米,在 AI 領網域有 AI 實驗室、小愛同學、自動駕駛等團隊。
此外,從服務能力協同來看,雷軍手中亦有金山雲這張底牌。金山雲是金山軟體的附屬公司,在公司掌舵人雷軍超前布局下,是與阿裡巴巴最早在中國全力進軍雲計算的企業。
要知道,ChatGPT 熱潮帶來的 AI 競争,最直接的受益者正是雲計算平台。一方面,生成式 AI 應用背後的大模型需要更強的算力;另一方面,區别于傳統雲計算平台提供的算力、存儲等資源,擁有大模型的雲廠商未來可以提供基于大模型開發應用。
早在今年 2 月的小米投資者日上,對于小米在 ChatGPT 上的布局,小米手機部總裁曾學忠就表示,ChatGPT 基于 AI 大模型、千億級參數量、數據量、還有人工标注支撐,AI 大模型方面小米一直都有投入。手機和汽車業務有很多 AI 大模型落地的場景。
随後,在今年 3 月的 2022 年财報電話會議上,小米集團總裁盧偉冰談到 ChatGPT 相關問題時表示,小米很早就在 AI 大模型方面進行了許多部署,同時采用了多技術路線并行的策略,小愛同學就是小米大模型落地的代表。
5 月 24 日晚,小米披露的 2023 年第一季度業績數據中提到,目前小米 AI 領網域相關研發人員超 1200 人,未來小米将不斷挖掘 AI 相關的用戶場景,發揮技術優勢,并以開放的态度與合作夥伴開拓更多機會。
盧偉冰再次強調,小米會積極擁抱大模型技術,但小米不會像 OpenAI 那樣去做通用大模型,而是尋求大模型與自身業務的深度協同,例如與小愛同學、MIUI、機器人等業務相結合,同時也不斷提升集團的内部工作效率。
小米副總裁、首席财務官林世偉也在業績電話會上透露," 已經把業内大模型團隊都過了一遍 ",小米會采用慣用的 " 打法 ",也就是戰略投資等方式,來實現 AI 大模型方面的生态合作。
第一季度業績數據還顯示,小米一季度持續投入研發,研發支出同比增長 17.7% 達 41 億元。小米表示,預計 2023 年總研發投入将超 200 億元。
從目前綜合信息來看,小米大模型 " 萬事俱備,只欠東風 "。下周一晚間,能否見證它的正式亮相,外界正翹首以待。