今天小編分享的科技經驗:智譜AI狂對标OpenAI,有勇氣沒實力?,歡迎閲讀。
1 月 16 日,AI 知識智能技術開發商智譜 AI 舉辦了首屆技術開放日(Zhipu DevDay),全面展示了其投身大模型事業三年多以來所積累的技術成果,并發布了新一代基座大模型 GLM-4。
智譜 AI CEO 張鵬表示,GLM-4 的整體性能相比上一代大幅提升,逼近 GPT-4,可以支持更長的上下文,具備更強的多模态能力。同時,GLM-4 的推理速度更快,支持更高的并發,大大降低推理成本。
圖源:智譜 AI
除此之外,GLM-4 大幅提升了智能體能力,GLM-4 All Tools 實現自主根據用户意圖,自動理解、規劃復雜指令,自由調用網頁浏覽器、Code Interpreter 代碼解釋器和多模态文生圖大模型以完成復雜任務。GLMs 個性化智能體定制功能亦同時上線,用户用簡單的提示詞指令就能創建屬于自己的 GLM 智能體,大幅降低了大模型使用門檻。
" 追趕 OpenAI"" 對标 Open AI 是智譜 AI 成立以來的目标 ",是張鵬在對外分享時屢次提及的幾句話,目前大模型的競争已經不再是從 0 到 1 的有與無之争,而是落地之争,各家大模型開始貼身肉搏,被稱為 " 中國 OpenAI" 的智譜 AI,究竟能否在大模型角逐戰中順利突圍?
01. 暫時難以對标 OpenAI
智譜 AI 作為國内第一開源大模型,有着較強的技術架構,但對标 OpenAI 仍有一些距離。
張鵬坦言,和國外大模型相比,國内的大模型發展起步晚了一些,加上高性能算力限制、數據質量的差距等,國内大模型在規模和核心能力上都與世界先進水平存在一定差距,這樣的差距大約在一年左右。
從技術路線來看,OpenAI 則更加注重通用性、可移植性和可擴展性,其 GPT 系列模型可以在多個場景下應用,并且具有高度的可定制性。相比之下,智譜 AI 的技術路線是 " 大模型 + 小模型 ",通過大模型的預訓練和微調,來适應不同場景和任務的需求。這種技術路線可以提高模型的泛化能力和應用範圍,但也存在着模型復雜度高、計算量大、訓練時間長等問題。
在模型規模,OpenAI 的 GPT 系列模型規模較大,可以處理大量的自然語言數據,從而獲得更好的模型性能。相比之下,智譜 AI 的模型規模可能較小,處理數據的能力有限,這可能會影響其模型性能和泛化能力。而在數據資源方面,OpenAI 擁有大量的自然語言數據資源,可以用來訓練和優化其模型。相比之下,智譜 AI 的數據資源可能相對較少,導致其模型訓練的效果和性能受到限制。
這意味着,想要盡快彌補與 OpenAI 之間的差距,智譜 AI 必須要持續提升大模型能力,訓練參數自然也需要提升,但硬币的另一面是,智譜 AI 在資金方面也将面臨着一個巨大的難題。
首先,硬體是一筆巨額投入,根據美國市場研究機構 TrendForce 推算,處理 ChatGPT 的訓練數據需要 2 萬枚 GPU 芯片,而随着 OpenAI 進一步展開 ChatGPT 和其他 GPT 模型的商業應用,其 GPU 需求量将突破 3 萬張(該報告計算以 A100 芯片為主)。
此外,訓練大模型的成本也不容小觑,根據國盛證券發布的《ChatGPT 需要多少算力》估算,GPT-3 訓練一次的成本約為 140 萬美元,對于一些更大的 LLM ( 大型語言模型 ) ,訓練成本介于 200 萬美元至 1200 萬美元之間。
巨額資金從哪裏來,以及能換回多少價值,對于智譜 AI 而言是一個未知數。
不過,好在智譜 AI 備受投資機構青睐。2023 年 10 月,智譜 AI 稱年内已成功融資超過 25 億人民币。這一重要的融資裏程碑得到了多家知名機構的積極支持,主要參與方包括社保基金、中關村自主創新基金、以及美團、螞蟻、阿裏、騰訊、小米、金山、順為資本、Boss 直聘、好未來、紅杉、高瓴等多家機構,同時也包括一些老股東的跟投。
圖源:天眼查
尤其是 2023 年至今,智譜 AI 接連拿下 5 輪融資,估值超過 100 億元,跻身國内 AI 領網域 " 獨角獸 " 企業。智譜 AI 表示,融資将被用于進一步推動其基座大模型的研發,以更好地支持廣泛的行業生态,促進與合作夥伴一起實現高速增長的願景。
02. 商業化高牆難越
商業化落地是驗證一項新技術價值的最直接的方式。現階段來看,國内大模型百花齊放,但大部分仍處于講技術、講發展的階段,對于商業化落地,基本上處于探索階段。
整體而言,大模型企業的盈利方式主要包括大模型、大模型 + 算力、大模型 + 應用。其中,大模型和大模型 + 算力為主要盈利方式。
智譜 AI 盈利方式和行業盈利方式基本一致,一是根據客户需求,提供大模型定制化開發服務,雲端私有化本地私有化最高價格分别為 120 萬元 / 年和 3690 萬元 / 年;二是标準版大模型,提供 API 接入方式,按照 Tokens 使用收費,ChatGLM-Turbo、CharacterGLM、Text-Embedding 收費标準分别為 0.005 元 / 千 Tokens、0.015 元 / 千 Tokens、0.005 元 / 千 Tokens。目前,智譜 AI 的商業化主要面向企業和機構的 B 端用户。
作為對比,OpenAI 的商業化同樣分為 C 端和 B 端兩個部分,具體而言,針對 C 端市場,OpenAI 推出 ChatGPT Plus 訂閲計劃,每月收費 20 美元,相較于免費版本,即便在高峰時段用户也能正常訪問 ChatGPT,響應時間更快,并且可以優先使用新功能等。而針對 B 端市場,OpenAI 發布了 ChatGPT API,開發者可以将 ChatGPT 集成到產品中,以更加高效地發揮出價值。
值得注意的是,OpenAI 還在 2023 年 8 月推出了企業服務版,該服務版有望每月給 OpenAI 帶來 6500 萬元的收入。整個 2023 年,OpenAI 推出的多項付費方案已經帶來了超過 110 億元的收入。
一個普遍的現象在于,包括智譜 AI 在内的國内大模型產品,在高投入的同時還難以帶來穩定的盈利。雖然大模型商業化之路道阻且長,但曙光已現。三六零 2023 年半年報顯示,"360 智腦 " 大模型已經開始創收,金額近 2000 萬元;商湯集團也公布,生成式 AI 在 2023 年上半年相關收入增長 670%。
愛分析相關報告指出,目前大模型商業化提速較快的行業為能源和金融,其原因在于這兩個行業密集分布的央國企。央國企數據基礎設施建設完備、算力投入高、AI 應用場景多且基礎強,這些原因促進央國企與大模型的快速融合。
對于智譜 AI 而言,目前大模型商業化的路徑已經較為清晰,但能否走通大模型的商業化之路,關鍵不僅在于商業模式的探索嘗試,更在于解決大模型發展的底層問題。
03. 國產大模型何去何從?
根據工信部賽迪研究院最新數據,2023 年我國語言大模型市場規模實現較快提升,應用場景不斷豐富。預計 2023 年我國大模型市場規模将達到 132.3 億元,增長率将達 110%。
未來,随着技術的不斷迭代進步,大模型将在具身智能、自動駕駛等領網域開拓新的應用場景。
具體而言,大模型的發展将有三大趨勢:首先是大模型智能能力的提升,未來大模型将具有更高的精度、更強的理解能力和更廣泛的适用性,這意味着大模型能夠更好地理解自然語言,還能夠進行更多的復雜任務,比如全網域控制、創作等等;其次是大模型将應用于更多領網域,除了傳統的文本處理之外,大模型也将在語音識别、影像生成、視頻理解等方面發揮更大的作用,用户可以在更多的場景中享受到 AI 帶來的便利。此外,大模型将更加定制化,能夠更好地滿足用户的個性化需求,用户可以根據自己的實際需求選擇合适的模型,并進行定制化配置。
大模型飛速發展,但并不意味着無序發展。未來,針對大模型的監管将愈加嚴格,2023 年 7 月,網信辦等七部門發布了《生成式人工智能服務暫行管理辦法》,明确規定大模型產品需注重數據隐私安全,不能非法獲取、披露、利用個人信息和隐私、商業秘密,不可侵犯知識產權;大模型生成的内容應當體現社會主義核心價值觀,不能生成歧視性的内容等等。
對于大模型的未來,張鵬顯得十分樂觀,"2024 年,大模型市場将從野蠻生長回歸冷靜,對于大模型的投資與炒作将會告一段落,行業焦點也将從模型本身轉向尋找應用。不過這并不代表大模型的技術演進速度會下降,向上探索的天花板還遠遠沒到。"