今天小編分享的互聯網經驗:國内大模型進入公開賽,歡迎閱讀。
作者 | 劉寶丹
編輯 | 周智宇
如火如荼的 " 百模大戰 " 迎來關鍵一步,即走向市場化發展。
8 月 31 日,百度宣布,文心一言通過《生成式人工智能服務管理暫行辦法》備案,用戶可以在官網或應用商店下載使用。這意味着,這款最先對标 ChatGPT 的大語言模型,結束了 5 個月的邀測模式,正式向公眾開放。
不僅是百度,據了解,已公布完成備案的大模型企業還包括字節、商湯、中科院旗下紫東太初、百川智能、智譜華章等 7 家。
這只是開始,由于公布時間不一,未來還會有更多大模型公司披露備案情況。多家企業對華爾街見聞表示,已首批完成備案提交,但目前沒有公布。
阿裡雲内部人士對華爾街見聞表示," 通義千問 " 已完成備案工作,待正式上線。他透露,首批通過備案的企業名單,預計将在 1 周内陸續由各地方相關管理部門通過。
大模型在法律層面完成備案,意味着我國大模型将徹底走出試驗區,接受市場公眾的反饋和檢驗,這同時意味着我國生成式人工智能将進入商業化新階段。
不得不面對的現實是,大模型賽道變得越來越擁擠。賽迪顧問數據顯示,截至 2023 年 7 月,中國累計已經有 130 個大模型問世,僅 2023 年 1-7 月,就有共計 64 個大模型發布。
對大模型賽道的投資也在不斷加碼。年初,IDC 在《中國人工智能計算力發展評估報告》中預測,2022 年中國人工智能市場相關支出将達到 130.3 億美元,有望在 2026 年達到 266.9 億美元,2022 至 2026 年年復合增長率達 19.6%。
這也導致大模型賽道產品嚴重同質化。
據華爾街見聞觀察,目前已上線的文心一言、訊飛星火、百川大模型、商量 SenseChat、抖音豆包、智譜清言等產品高度相似,都提供問答功能,并具備一定的内容創作能力。
具體來看,智譜清言支持多輪對話,具備内容創作、信息歸納總結等能力;文心一言能夠與人對話互動,協助創作;百川大模型也聲稱在知識問答、文本創作領網域表現突出。
随着大模型公司下場搶占市場份額,一場短兵相接的公開賽将不可避免的上演,大模型公司要想成功突圍并非易事。
百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜日前對全天候科技表示,大模型產業化面臨三方面挑戰,除了訓練難度高、算力要求大,收集、挖掘、建設、篩選、清洗數據也是非常大的工程。
在驅動人工智能發展的三大要素中,算力和算法更多與企業研發實力有關,唯獨數據需要更多從市場中獲取。而且人工智能的特點是随着數據量的增長,其獲取知識的能力也越來越強,數據堪比生產資料。
這也意味着,數據 " 填喂 " 是大模型商業化的前提,誰能獲取更多用戶,也就有擁有了更多籌碼,這也是為什麼百度、商湯、科大訊飛、360 都在大力宣傳自家大模型產品的原因。
百度董事長兼首席執行官李彥宏就表示,當文心一言向數以億計互聯網用戶大規模開放服務後,能夠獲得大量真實世界中的人工反饋,這将進一步改進基礎模型。
從這一點來看,時間在很大程度上意味着先發優勢,先獲取用戶并積累更多有效數據,更有利于提升大模型的學習速度,進而掌握發展的主動權。
此外,推出更多應用、深入更多場景也是提高大模型能力的普遍做法,比如,商湯商量通過提供 API 接口和服務在眾多垂直行業實現各類生成式 AI 應用,百度、科大訊飛等都在不斷提高產品的豐富度。
大模型的商業化之路才剛開始,但各家都已蓄勢待發。8 月 30 日,360 在半年報中公布了一組數據:360 智腦已創造近 2000 萬元相關業務收入。這是國内首個披露收入的大模型產品。
接下來,還會有更多商業化數據出現,總之,大模型的商業化戰役打響了。