今天小編分享的互聯網經驗:科大訊飛劉慶峰:大模型不在一朝一夕,重要的是落地解決剛需和自我造血,歡迎閱讀。
科大訊飛董事長劉慶峰
進入 2023 年,由 ChatGPT 帶動的 AI 產品成為了科技行業的新熱點,國外的谷歌、Meta 相繼跟進,國内百度的 " 文心一言 ",阿裡的 " 通義千問 ",商湯科技的 " 日日新 " 也先後入局。
5 月 6 日,科大訊飛發布了訊飛星火認知大模型,并于發布會現場演示了產品的七項核心能力,包括語音輸入,實時互動、文本生成、語言理解、知識問答、邏輯推理和數學能力,目前星火認知大模型已可應用于教育、辦公、汽車、數字員工四個領網域。
在被問到為何產品姗姗來遲的時候,科大訊飛董事長劉慶峰表示,大模型的競争關鍵不在于發布日期那一朝一夕,更重要的是,要今早落地轉化為產品,解決用戶的剛需,實現自我造血。
正視數據算力差距,用國產化降低不确定性
圖片來源:視覺中國
目前,以 GPT 為首的大模型產品,主要是通過機器的不斷學習去實現人工智能的進化。期間需要原始的數據資料,通過各家的算法,調用 GPU 的算力去執行。
對于國内廠商而言,要打造一款大模型產品,由于 OpenAI 的 GPT 珠玉在前,算法目前來看并不會是瓶頸,而數據和算力會是相對的短板。
數據方面,由于中文互聯網起步較晚,且微信、頭條、微博、百度各家的數據較為封閉,導致可用于大模型訓練的數據量不多。
從數據質量方面,中文互聯網也沒有優勢。科大訊飛副總裁、研究院院長劉聰對钛媒體 App 舉了一個例子:" 中文技術論壇經常出現的情況是,一開始都是在讨論學術,到最後就變成了吵架。"
對此,劉聰表示科大訊飛目前正在使用中英文混合的數據庫,希望能夠将英文有價值的東西轉化成中文資料的增量,借此實現對 AI 的提升。此外,科大訊飛在教育等行業已經有了多年的積累,相關數據也能夠進一步幫助 AI 進行訓練。
算力方面,此次科大訊飛與華為、寒武紀、曙光等公司合作,借此實現國產化,降低不确定性。
但劉慶峰也坦言,雖然目前算力方面不會受到國外的限制,但整體與國外相比,存在至少一代的差距。但算力和數據是中國廠商共同的的短板,而非科大訊飛一家的短板。
快速落地,形成商業模式
全球首款搭載大模型的 AI 學習機:科大訊飛AI 學習機 T20 Pro
劉慶峰表示,未來大模型的關鍵并不是算力,而是要把教育、辦公、汽車、數字員工一類的子模型聯動起來,形成 "1+N" 的布局。
其中 "1" 作為大模型的本身,具備自己的商業價值,而 "N" 則是教育、辦公、汽車、數字員工一類的子模型,可以讓產品更快落地,快速形成商業模式。随後不同的任務、不同的數據再回歸到 1,組成一整個循環的過程。
據科大訊飛介紹,目前星火認知大模型的核心團隊在 200 人以上,外圍團隊 2000 人以上,另外還有大量負責數據标注的人員。
根據第三方中文通用大模型基準 SuperCLUE 測試基準的測試顯示,目前科大訊飛星火認知大模型僅次于人類、GPT4 和 GPT3.5,在眾多大模型中名列第四位,在中國廠商中排名第一。
劉慶峰透露,今年 6 月 9 日星火大模型将突破開放式問答,多輪對話能力和數學能力将再次更新;8 月 15 日,星火認知大模型将突破代碼能力,多模态互動再更新;10 月 24 日,星火認知大模型通用模型将直接對标 ChatGPT,其中中文能力超越後者,英文能力與後者相當。
在談到未來是否可能被美國制裁的話題時,劉慶峰表示已做好相關準備,并積極推進國產化替代,當然前提是把產品做好。(本文首發钛媒體 App,作者 / 吳泓磊,編輯 / 鍾毅)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App