今天小編分享的科學經驗:2年間AI大模型成本驟降萬倍,商業化應用加速跑,歡迎閲讀。
對于 AGI,大模型六小虎之一的智譜有自己的理解,他們把 AGI 分為五個等級:
第一級是語言,智譜 " 已經做得非常不錯了 ";
第二級是對復雜問題的求解,可以看到 o1 水平模型能力出現;
第三級是使用工具,比如自主智能體不但能夠通過 API,還可以像人一樣操作手機、PC 甚至汽車的界面來獲取信息;
第四級是自我學習;
第五級是超越人類,AI 将具備探究科學規律、世界起源等終極問題的能力所以通往 AGI 之路将是一個清晰和明确的鏈路。
本次量子位 MEET 2025 智能未來大會上,智譜 COO 張帆熱情分享了智譜大模型的發展、應用、商業化發展、未來方向,以及企業和個人的科技戰略構建。
為了完整體現張帆的思考,在不改變原意的基礎上,量子位對演講内容進行了編輯整理,希望能給你帶來更多啓發。
MEET 2025 智能未來大會是由量子位主辦的行業峰會,20 餘位產業代表與會讨論。線下參會觀眾 1000+,線上直播觀眾 320 萬 +,獲得了主流媒體的廣泛關注與報道。
核心觀點梳理
大模型天然是一個應用導向的技術;
一條曲線是能力上升,一條曲線是成本下降,帶來技術能力快速地落地和應用;
通往 AGI 之路将是一個清晰和明确的鏈路;
AI 開始變成基礎生產要素;
意識到模型的技術效果不及預期不難,難的是找到 " 怎麼能行 " 的一條路;
大模型的文本模型成為你的大腦,多模态模型成為你的眼睛,自主智能體模型成為你的雙手
模型場景越來越從淺水區進入到深水區;
不管基座模型是國内的、國外的,開源的、閉源的,合适的才是最好的。
……
以下為張帆演講全文:
2 年時光飛逝,鋪開一個迅猛發展的大模型時代
大家好,非常高興今天有機會能夠跟大家做一些分享。
智譜算是在國内最早做大模型商業化的公司,我們在過去的一兩年當中也走了很多彎路,踩了很多坑,有一些成績。今天希望跟大家分享一下我們在商業上面的一些思考,大模型如何跟商業能夠應用起來。
其實我覺得今天大家經常會有一個問題,大模型是不是變慢了?是不是已經到瓶頸了?是不是增長得不夠快了?
我們在開始的時候可以簡單做一個小的回顧,看看過去的兩年間到底發生了什麼。
首先一點,大家可以看到在早期的時候,ChatGPT 發布後只用了兩個月的時間,全球用户就過億。這是一個前所未有的現象級增速,比人類歷史上所有技術進展速度都要快——電話用了 75 年才達到這個成就,這是一個直接進入到應用的技術。
它也不像其它很多技術,一般來説,技術往往都是先有一個概念,然後從這個概念出發,不停嘗試讓它一點一點落地,最後落實。
今天的大模型不太一樣,我相信絕大多數的各位都不是先知道了這個概念,而是先知道了某一款應用。所以大模型天然是一個應用導向的技術。
很多分析都提出,生成式 AI 進入市場的速度遠比互聯網和 PC 要快,并且在過去兩年間,整個模型帶來了非常大的變化。
模型能力飛速提升
以一個計算基準來看,僅僅 2 年時間,整個模型的行業水平就從 60 分漲到了将近 90 分。通常而言,低分段漲分容易,高分段漲分不容易。但僅僅用了兩年時間,智能就提升了這麼多。
與 OpenAI 的折現軌迹相比,能看到智譜基本上跟緊上了國際步伐。
再説上下文視窗。我記得去年剛開始做模型商業化的時候,基本标配是 4K 基本,現在 100 萬才是基本門檻,甚至很難算是合格的能力。今天很多模型視窗都達到了 100 萬、200 萬字,能裝的東西已經非常多了。
我們也能看到一系列從單一模态到多模态、從文本模型到多模态模型,甚至是自主智能體模型等等的現象出現,模型的能力變得越來越豐富。
這一切僅僅用了 2 年時間。我們回想移動互聯網時代,iPhone 發布兩年之後,真正的殺手級的應用都還沒有出現。
但是在今天,模型發展已經非常快,從各個方位上都全面得到了提升。
模型成本極速下降
與之相對應的是模型成本的下降,且無論是國内外。
連 OpenAI 也降低了幾十倍,并且還在持續下降。
國内更是如此。記得去年剛剛開始做商業化的時候,智譜當時還是 5 毛錢 1000 個 tokens,但今天最低已經到了 5 分錢 100 萬個 tokens ——這是 1 萬倍。
也就是説,在過去兩年間,這個市場降價降了 1 萬倍,能力變得比原來更強。
一條曲線是能力上升,一條曲線是成本下降,帶來的是什麼?
帶來技術能力快速地落地和應用,這是背景。
通往 AGI 共 5 級階段,路徑清晰,方向明确
這個過程當中,有這樣一個背景。那麼,未來往哪去?大家更常會問,我們今天到了哪一步。
之前 OpenAI 發布了對于 AGI 目标能力的分級,智譜也給出了一些自己的理解。
我覺得這個路徑還是比較清楚的:
第一級是語言。我們已經做得非常不錯了,基本上可以通過圖靈測試。
第二級是對復雜問題的求解。可以看到 01 這樣的能力出現,讓我們對模型的應用類似從「大腦的系統 1」轉化為「系統 2」,從簡單直覺的回答,變成了能夠深度性的思考和拆解。
第三級開始使用工具。過去回答復雜問題的時候,不但需要能直接做深度的思考,還需要能夠跟外界持續地互動獲取信息。我們之前做了很多像 Function calling(函數調用),如何在過程中把需求轉化為一個請求,通過 API 的方式取外部的數據,類似于這樣的方式補充内容。
也有包括像我們自己發布的自主智能體,不但能夠通過 API,還可以像人一樣操作手機、PC 甚至汽車的界面,從裏面獲取信息。
第四級是實現自我學習。AGI 已經不滿足人們談論和探索的空間了,已經開始讨論 ASI 了。如果把人類的智能作為基準,而技術機器的智能在逐步上升。
随着人給它标注數據,技術機器智能的曲線值逐步提升,某一天達到了人類的智能這條線,我們該怎麼标數據?它怎麼獲取更多的知識?
今天還有很多談論,已經看到了 ASI 和 Super Alignment 的初步進展,我覺得在今天看起來,這幾步還是或多或少都有了一些進展的。
在這裏面,智譜也不斷地探索和豐富模型的能力,從最開始的語言能力,到 L2 的復雜問題的能力,到工具能力,以及現在正在試圖去解決的第四級别的 GLM-zero 和 GLM-OS 等能力。
第五級還沒有非常明确的定義,但是方向在那,是超越人類,AI 将具備探究科學規律、世界起源等終極問題的能力。
AI 開始變成基礎生產要素,帶來商業底層變化
這一次,大模型不只是帶來了技術上的變革,與以往相比,也帶來了更多在商業上的可能性。
在移動互聯網時代,所有的任務都是獨立的,你需要從很多種算法中挑一種做實驗,解決一個小問題,比如分詞、詞性标注、實體識别等。
那個時候,使用 AI 的門檻的成本是很高的,所以只有那種高杠杆的業務才能應用,比如搜索引擎、推薦引擎。也就是説,只有那種上千萬、上億的人在應用,且邊際成本幾乎為零的應用,大家才能夠去用 AI。那個時候基本上只有互聯網大廠在應用 AI。
到 2013、2014 年神經網絡成熟之後,某種程度上,算法層被統一了,大家不用學各種各樣的算法了。
所以一定程度上門檻有了第一次普惠化,成本也下降。這樣的結果就是 AI 能力開始進入到產業跟行業。
而今天,從算法到模型,到數據,再到任務,整個大模型幾乎把一切都統一。
再加上有 Zero-shot 和 Few-shot 的能力,我們從針對一個任務去訓一個模型,變成可以直接去應用模型了。
它不但帶來了更強大的能力,還讓我們模型的生產成本比原來下降了至少兩個數量級,可能 100 倍。
原來做一個什麼樣的簡歷抽取,不搞上幾個算法科學家,搞上半年,根本搞不定,但幾百萬經費就出去了;但是今天來講,借助大模型,一個運營的人員,一個產品的人員,哪怕不會編程,基本上可以花上一周就能解決這個復雜的問題,并且效果還不差。
在這樣的背景下,AI 開始變成基礎生產要素,這就導致帶來商業底層的很多變化,此外,上層的變化,包括工作方式、組織形式、商業模式甚至每個企業的壁壘,可能都會發生變化。
從智譜模型矩陣發展,看應用 AI 和 AI 應用的未來
接下來可以跟大家分享幾個最新的模型方面的進展。
首先,今天的智譜有非常完備的模型矩陣,包括語言模型、代碼模型、多模态模型、超拟人模型,到自主智能體。
語言模型方面,既有可以跑在 PC、汽車、手機等設備上的端側的模型,也有開源或商用的模型。這一點代碼大模型也是一樣。
多模态模型方面,各種維度,從文生視頻、視頻理解、文生影像、影像理解等,智譜都有多方面的矩陣,能夠滿足用户不同需求。再包括智譜還有拟人大模型、心理大模型,以及自主智能體。
這兩天 Sora Turbo 剛發布,大家都覺得裏面有很多地方還不夠完美,我覺得這非常正常,因為這是一個很早期的技術。
找到它哪不行,這件事不難,我們大家都可以批評它;很難的是找到怎麼能行的那條路。
其實在 GPT-3 時代,就有像 Jasper 這樣的公司,一年有幾千萬美金的 ARR。所以能夠找到模型與業務的最大公約數,是我們今天做商業化裏面的一個重要環節。
智譜最早的多模态模型,其實也是最不完善的版本,只是把莫奈的名畫動起來,然後拼了一下,還是會有一些穿幫的地方。但是本質上來講,已經足以幫助旅遊局做一個小宣傳片。
今天用大模型來做這樣一個視頻,成本就 10 塊、20 塊,成本極低;但如果用 CG 來做,沒一兩百萬做不下來。
與此同時,我們看到了未來對于内容生成應用的可能性。
對于一段視頻,以前用 CV 的方式,很難做泛化性理解,今天的大模型在幾乎不訓練的情況下,可以很好地回答視頻裏的人在幹什麼?有沒有精彩時刻?精彩時刻在多少秒?
還有一些端側模型方面的激戰。之前在高通骁龍峰會上,智譜聯合他們聯合發布了 demo,在 8Gen4 手機上完全可以驅動一個多模态的模型實現很好的效果。并且,智譜構建了非常完備的端雲一體化的同源解決方案,可以讓用户在設備端很好地應用大模型的能力。
再比如視頻通話,大家可以一邊對話,一邊在視頻裏跟 AI 做交流。最早是 OpenAI 在 5 月發布了這個功能,但其實沒有真正讓終端用户用起來。在今年 8 月,智譜已經把這個功能全量發布在智譜清言上了,大家可以去嘗試。
而自主智能體,能夠讓 AI 自動化幫你完成多達幾十步的,甚至跨應用的復雜任務。大模型的文本模型成為你的大腦,多模态模型成為你的眼睛,自主智能體模型成為你的雙手,不但能夠幫你做思考,還能幫你做執行。
智譜也提供了一整套的方案,可以幫助開發者更輕松地訓練一個私有模型,也可以基于模型的能力快速開發一個智能應用,可以幫助大家來解決行業實踐。
大家使用模型的場景越來越多,越來越從淺水區進入到深水區——
2 年間,大家的需求從 " 有一個模型 ",到 " 模型幫忙提升產品指标 ",到今天 " 模型就要帶來業務結果 ",從各個方面來看,大家對模型的應用需求和實踐變得越來越務實,确實讓模型已經開始從智力生產變成生產力。
快速講幾個例子:
我們在汽車上可以非常好地重塑智能駕艙體驗;一些非常復雜的垂直領網域,比如公積金相關的復雜的問答,或邏輯推理等很多場景裏,或企業内部的 Chatbot 自動化的問數生成 Circle 的能力,用智譜模型都有做不錯的效果。
最後跟大家探讨一下大模型時代,企業或者個人該如何去構建自己的科技戰略。
我覺得這裏面關鍵來講四個要素:
選擇合适的基座,要構建與戰略目标和業務屬性相匹配的組織,基于場景和 AI 的能力來重新定義數據資產,并且把這些能力無縫融入到業務當中,從而來形成飛輪。
這裏面很多東西需要大家深度思考。
不管基座模型是國内的、國外的,開源的、閉源的,我覺得其實合适的才是最好的,所以這裏面涉及每一個環節的每一個問題,都需要大家自己思考。
我們也希望借助四樣能力,為每個企業構建自己科技戰略新飛輪,随着每一輪的轉動能夠幫我們沉澱更多的能力,構建更多的壁壘。
謝謝大家!
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>