今天小編分享的互聯網經驗:科大訊飛更新星火大模型,持續推動AI大模型產業化應用,歡迎閲讀。
文 | 王方玉
編輯 | 蘇建勳
有 " 通用大模型國家隊 " 之稱的科大訊飛,再次更新大模型能力。
10 月 24 日,第七屆世界聲博會暨 2024 科大訊飛全球 1024 開發者節開幕式上,科大訊飛董事長劉慶峰發布了訊飛星火 4.0 Turbo。
劉慶峰介紹稱,訊飛星火 4.0 Turbo 全新更新,根據鮮活的真實數據背靠背測試,七大能力全面超過 GPT-4 Turbo,數學能力、代碼能力超過 GPT-4o,國内外中英文 14 項主流測試集中實現 9 項第一。
發布會現場,科大訊飛還展示了大模型在多模态互動能力上的進展。據了解,在原有的遠場高噪、全雙工、多語種多方言能力上,此次更新了多模态能力,新增了超拟人和個性化能力,實現了語音、視頻、圖文全部聯動的多模态互動。
算力方面,科大訊飛一直堅持基于國產算力打造自主可控通用大模型底座。去年 10 月,科大訊飛曾聯合華為推出首個國產萬卡規模大模型算力平台 " 飛星一号 "。
本次發布會上,科大訊飛、華為、合肥市大數據資產運營有限公司三方聯合打造的國產超大規模智算平台 " 飛星二号 " 也正式啓動。劉慶峰表示,此次啓動更新版的 " 飛星二号 ",将帶來新模型新算法的持續适配和智算集群規模的再次躍遷,引領國產大模型底座的發展、給世界提供第二選擇。
今年以來,有一批大模型公司停下了預訓練的腳步。預訓練模型是大模型公司的底層核心技術,停了通常意味着走下了牌桌。通過更新星火模型和啓動新智算平台,科大訊飛傳達了持續預訓練的态度和信心。
科大訊飛研究院院長劉聰在接受 36 氪采訪時表示,訊飛的大語言模型會堅持迭代,在類似于 o1 大模型、多模态互動、語音端到端等方面持續布局。
劉聰坦言,訊飛的算力規模不及頭部大廠;使用國產算力平台,也需要花費不少額外精力進行适配等工作,但訊飛堅持基于國產算力打造和更新自主可控的通用底座大模型,在國内芯片和算力集群相較于國外領先水平有一定差距的情況下,做出了可觀的效果。
據介紹,在過去一年多的實踐中,星火大模型在 " 飛星一号 " 上的訓練推理性能不斷優化,部分測試集表現甚至超過國際領先的 GPT-4 Turbo。
在大模型產業化應用方面,科大訊飛一直推進積極,致力于 " 用人工智能技術解決社會剛需 "。公開信息顯示,今年 1-9 月,科大訊飛成功得標 38 個項目,披露的得標金額為 2.16 億元,項目數量和金額,均在行業内排名首位。
" 未來 AI 技術的探索 , 必須大規模產業化 , 必須在場景中進入到真正的深水區 , 所有玩‘概念’的都不會有大未來。" 劉慶峰在演講中表示。
發布會上,基于訊飛星火底座能力,科大訊飛面向教育、醫療、司法、政務服務、企業辦公等多個行業場景發布了最新的產品應用。據悉,截至 2024 年 10 月,科大訊飛已與各頭部企業共建 20 多個行業大模型,覆蓋了 300+ 應用場景。