科大訊飛劉慶峰：大模型不在一朝一夕，重要的是落地解決剛需和自我造血

今天小編分享的互聯網經驗：科大訊飛劉慶峰：大模型不在一朝一夕，重要的是落地解決剛需和自我造血，歡迎閱讀。

科大訊飛董事長劉慶峰

進入 2023 年，由 ChatGPT 帶動的 AI 產品成為了科技行業的新熱點，國外的谷歌、Meta 相繼跟進，國内百度的 " 文心一言 "，阿裡的 " 通義千問 "，商湯科技的 " 日日新 " 也先後入局。

5 月 6 日，科大訊飛發布了訊飛星火認知大模型，并于發布會現場演示了產品的七項核心能力，包括語音輸入，實時互動、文本生成、語言理解、知識問答、邏輯推理和數學能力，目前星火認知大模型已可應用于教育、辦公、汽車、數字員工四個領網域。

在被問到為何產品姗姗來遲的時候，科大訊飛董事長劉慶峰表示，大模型的競争關鍵不在于發布日期那一朝一夕，更重要的是，要今早落地轉化為產品，解決用戶的剛需，實現自我造血。

正視數據算力差距，用國產化降低不确定性

圖片來源：視覺中國

目前，以 GPT 為首的大模型產品，主要是通過機器的不斷學習去實現人工智能的進化。期間需要原始的數據資料，通過各家的算法，調用 GPU 的算力去執行。

對于國内廠商而言，要打造一款大模型產品，由于 OpenAI 的 GPT 珠玉在前，算法目前來看并不會是瓶頸，而數據和算力會是相對的短板。

數據方面，由于中文互聯網起步較晚，且微信、頭條、微博、百度各家的數據較為封閉，導致可用于大模型訓練的數據量不多。

從數據質量方面，中文互聯網也沒有優勢。科大訊飛副總裁、研究院院長劉聰對钛媒體 App 舉了一個例子：" 中文技術論壇經常出現的情況是，一開始都是在讨論學術，到最後就變成了吵架。"

對此，劉聰表示科大訊飛目前正在使用中英文混合的數據庫，希望能夠将英文有價值的東西轉化成中文資料的增量，借此實現對 AI 的提升。此外，科大訊飛在教育等行業已經有了多年的積累，相關數據也能夠進一步幫助 AI 進行訓練。

算力方面，此次科大訊飛與華為、寒武紀、曙光等公司合作，借此實現國產化，降低不确定性。

但劉慶峰也坦言，雖然目前算力方面不會受到國外的限制，但整體與國外相比，存在至少一代的差距。但算力和數據是中國廠商共同的的短板，而非科大訊飛一家的短板。

快速落地，形成商業模式

全球首款搭載大模型的 AI 學習機：科大訊飛AI 學習機 T20 Pro

劉慶峰表示，未來大模型的關鍵并不是算力，而是要把教育、辦公、汽車、數字員工一類的子模型聯動起來，形成 "1+N" 的布局。

其中 "1" 作為大模型的本身，具備自己的商業價值，而 "N" 則是教育、辦公、汽車、數字員工一類的子模型，可以讓產品更快落地，快速形成商業模式。随後不同的任務、不同的數據再回歸到 1，組成一整個循環的過程。

據科大訊飛介紹，目前星火認知大模型的核心團隊在 200 人以上，外圍團隊 2000 人以上，另外還有大量負責數據标注的人員。

根據第三方中文通用大模型基準 SuperCLUE 測試基準的測試顯示，目前科大訊飛星火認知大模型僅次于人類、GPT4 和 GPT3.5，在眾多大模型中名列第四位，在中國廠商中排名第一。

劉慶峰透露，今年 6 月 9 日星火大模型将突破開放式問答，多輪對話能力和數學能力将再次更新；8 月 15 日，星火認知大模型将突破代碼能力，多模态互動再更新；10 月 24 日，星火認知大模型通用模型将直接對标 ChatGPT，其中中文能力超越後者，英文能力與後者相當。

在談到未來是否可能被美國制裁的話題時，劉慶峰表示已做好相關準備，并積極推進國產化替代，當然前提是把產品做好。（本文首發钛媒體 App，作者 / 吳泓磊，編輯 / 鍾毅）

更多精彩内容，關注钛媒體微信号（ID：taimeiti），或者下載钛媒體 App