2年間AI大模型成本驟降萬倍，商業化應用加速跑

今天小編分享的科學經驗：2年間AI大模型成本驟降萬倍，商業化應用加速跑，歡迎閲讀。

對于 AGI，大模型六小虎之一的智譜有自己的理解，他們把 AGI 分為五個等級：

第一級是語言，智譜 " 已經做得非常不錯了 "；

第二級是對復雜問題的求解，可以看到 o1 水平模型能力出現；

第三級是使用工具，比如自主智能體不但能夠通過 API，還可以像人一樣操作手機、PC 甚至汽車的界面來獲取信息；

第四級是自我學習；

第五級是超越人類，AI 将具備探究科學規律、世界起源等終極問題的能力所以通往 AGI 之路将是一個清晰和明确的鏈路。

本次量子位 MEET 2025 智能未來大會上，智譜 COO 張帆熱情分享了智譜大模型的發展、應用、商業化發展、未來方向，以及企業和個人的科技戰略構建。

為了完整體現張帆的思考，在不改變原意的基礎上，量子位對演講内容進行了編輯整理，希望能給你帶來更多啓發。

MEET 2025 智能未來大會是由量子位主辦的行業峰會，20 餘位產業代表與會讨論。線下參會觀眾 1000+，線上直播觀眾 320 萬 +，獲得了主流媒體的廣泛關注與報道。

核心觀點梳理

大模型天然是一個應用導向的技術；

一條曲線是能力上升，一條曲線是成本下降，帶來技術能力快速地落地和應用；

通往 AGI 之路将是一個清晰和明确的鏈路；

AI 開始變成基礎生產要素；

意識到模型的技術效果不及預期不難，難的是找到 " 怎麼能行 " 的一條路；

大模型的文本模型成為你的大腦，多模态模型成為你的眼睛，自主智能體模型成為你的雙手

模型場景越來越從淺水區進入到深水區；

不管基座模型是國内的、國外的，開源的、閉源的，合适的才是最好的。

……

以下為張帆演講全文：

2 年時光飛逝，鋪開一個迅猛發展的大模型時代

大家好，非常高興今天有機會能夠跟大家做一些分享。

智譜算是在國内最早做大模型商業化的公司，我們在過去的一兩年當中也走了很多彎路，踩了很多坑，有一些成績。今天希望跟大家分享一下我們在商業上面的一些思考，大模型如何跟商業能夠應用起來。

其實我覺得今天大家經常會有一個問題，大模型是不是變慢了？是不是已經到瓶頸了？是不是增長得不夠快了？

我們在開始的時候可以簡單做一個小的回顧，看看過去的兩年間到底發生了什麼。

首先一點，大家可以看到在早期的時候，ChatGPT 發布後只用了兩個月的時間，全球用户就過億。這是一個前所未有的現象級增速，比人類歷史上所有技術進展速度都要快——電話用了 75 年才達到這個成就，這是一個直接進入到應用的技術。

它也不像其它很多技術，一般來説，技術往往都是先有一個概念，然後從這個概念出發，不停嘗試讓它一點一點落地，最後落實。

今天的大模型不太一樣，我相信絕大多數的各位都不是先知道了這個概念，而是先知道了某一款應用。所以大模型天然是一個應用導向的技術。

很多分析都提出，生成式 AI 進入市場的速度遠比互聯網和 PC 要快，并且在過去兩年間，整個模型帶來了非常大的變化。

模型能力飛速提升

以一個計算基準來看，僅僅 2 年時間，整個模型的行業水平就從 60 分漲到了将近 90 分。通常而言，低分段漲分容易，高分段漲分不容易。但僅僅用了兩年時間，智能就提升了這麼多。

與 OpenAI 的折現軌迹相比，能看到智譜基本上跟緊上了國際步伐。

再説上下文視窗。我記得去年剛開始做模型商業化的時候，基本标配是 4K 基本，現在 100 萬才是基本門檻，甚至很難算是合格的能力。今天很多模型視窗都達到了 100 萬、200 萬字，能裝的東西已經非常多了。

我們也能看到一系列從單一模态到多模态、從文本模型到多模态模型，甚至是自主智能體模型等等的現象出現，模型的能力變得越來越豐富。

這一切僅僅用了 2 年時間。我們回想移動互聯網時代，iPhone 發布兩年之後，真正的殺手級的應用都還沒有出現。

但是在今天，模型發展已經非常快，從各個方位上都全面得到了提升。

模型成本極速下降

與之相對應的是模型成本的下降，且無論是國内外。

連 OpenAI 也降低了幾十倍，并且還在持續下降。

國内更是如此。記得去年剛剛開始做商業化的時候，智譜當時還是 5 毛錢 1000 個 tokens，但今天最低已經到了 5 分錢 100 萬個 tokens ——這是 1 萬倍。

也就是説，在過去兩年間，這個市場降價降了 1 萬倍，能力變得比原來更強。

一條曲線是能力上升，一條曲線是成本下降，帶來的是什麼？

帶來技術能力快速地落地和應用，這是背景。

通往 AGI 共 5 級階段，路徑清晰，方向明确

這個過程當中，有這樣一個背景。那麼，未來往哪去？大家更常會問，我們今天到了哪一步。

之前 OpenAI 發布了對于 AGI 目标能力的分級，智譜也給出了一些自己的理解。

我覺得這個路徑還是比較清楚的：

第一級是語言。我們已經做得非常不錯了，基本上可以通過圖靈測試。

第二級是對復雜問題的求解。可以看到 01 這樣的能力出現，讓我們對模型的應用類似從「大腦的系統 1」轉化為「系統 2」，從簡單直覺的回答，變成了能夠深度性的思考和拆解。

第三級開始使用工具。過去回答復雜問題的時候，不但需要能直接做深度的思考，還需要能夠跟外界持續地互動獲取信息。我們之前做了很多像 Function calling（函數調用），如何在過程中把需求轉化為一個請求，通過 API 的方式取外部的數據，類似于這樣的方式補充内容。

也有包括像我們自己發布的自主智能體，不但能夠通過 API，還可以像人一樣操作手機、PC 甚至汽車的界面，從裏面獲取信息。

第四級是實現自我學習。AGI 已經不滿足人們談論和探索的空間了，已經開始讨論 ASI 了。如果把人類的智能作為基準，而技術機器的智能在逐步上升。

随着人給它标注數據，技術機器智能的曲線值逐步提升，某一天達到了人類的智能這條線，我們該怎麼标數據？它怎麼獲取更多的知識？

今天還有很多談論，已經看到了 ASI 和 Super Alignment 的初步進展，我覺得在今天看起來，這幾步還是或多或少都有了一些進展的。

在這裏面，智譜也不斷地探索和豐富模型的能力，從最開始的語言能力，到 L2 的復雜問題的能力，到工具能力，以及現在正在試圖去解決的第四級别的 GLM-zero 和 GLM-OS 等能力。

第五級還沒有非常明确的定義，但是方向在那，是超越人類，AI 将具備探究科學規律、世界起源等終極問題的能力。

AI 開始變成基礎生產要素，帶來商業底層變化

這一次，大模型不只是帶來了技術上的變革，與以往相比，也帶來了更多在商業上的可能性。

在移動互聯網時代，所有的任務都是獨立的，你需要從很多種算法中挑一種做實驗，解決一個小問題，比如分詞、詞性标注、實體識别等。

那個時候，使用 AI 的門檻的成本是很高的，所以只有那種高杠杆的業務才能應用，比如搜索引擎、推薦引擎。也就是説，只有那種上千萬、上億的人在應用，且邊際成本幾乎為零的應用，大家才能夠去用 AI。那個時候基本上只有互聯網大廠在應用 AI。

到 2013、2014 年神經網絡成熟之後，某種程度上，算法層被統一了，大家不用學各種各樣的算法了。

所以一定程度上門檻有了第一次普惠化，成本也下降。這樣的結果就是 AI 能力開始進入到產業跟行業。

而今天，從算法到模型，到數據，再到任務，整個大模型幾乎把一切都統一。

再加上有 Zero-shot 和 Few-shot 的能力，我們從針對一個任務去訓一個模型，變成可以直接去應用模型了。

它不但帶來了更強大的能力，還讓我們模型的生產成本比原來下降了至少兩個數量級，可能 100 倍。

原來做一個什麼樣的簡歷抽取，不搞上幾個算法科學家，搞上半年，根本搞不定，但幾百萬經費就出去了；但是今天來講，借助大模型，一個運營的人員，一個產品的人員，哪怕不會編程，基本上可以花上一周就能解決這個復雜的問題，并且效果還不差。

在這樣的背景下，AI 開始變成基礎生產要素，這就導致帶來商業底層的很多變化，此外，上層的變化，包括工作方式、組織形式、商業模式甚至每個企業的壁壘，可能都會發生變化。

從智譜模型矩陣發展，看應用 AI 和 AI 應用的未來

接下來可以跟大家分享幾個最新的模型方面的進展。

首先，今天的智譜有非常完備的模型矩陣，包括語言模型、代碼模型、多模态模型、超拟人模型，到自主智能體。

語言模型方面，既有可以跑在 PC、汽車、手機等設備上的端側的模型，也有開源或商用的模型。這一點代碼大模型也是一樣。

多模态模型方面，各種維度，從文生視頻、視頻理解、文生影像、影像理解等，智譜都有多方面的矩陣，能夠滿足用户不同需求。再包括智譜還有拟人大模型、心理大模型，以及自主智能體。

這兩天 Sora Turbo 剛發布，大家都覺得裏面有很多地方還不夠完美，我覺得這非常正常，因為這是一個很早期的技術。

找到它哪不行，這件事不難，我們大家都可以批評它；很難的是找到怎麼能行的那條路。

其實在 GPT-3 時代，就有像 Jasper 這樣的公司，一年有幾千萬美金的 ARR。所以能夠找到模型與業務的最大公約數，是我們今天做商業化裏面的一個重要環節。

智譜最早的多模态模型，其實也是最不完善的版本，只是把莫奈的名畫動起來，然後拼了一下，還是會有一些穿幫的地方。但是本質上來講，已經足以幫助旅遊局做一個小宣傳片。

今天用大模型來做這樣一個視頻，成本就 10 塊、20 塊，成本極低；但如果用 CG 來做，沒一兩百萬做不下來。

與此同時，我們看到了未來對于内容生成應用的可能性。

對于一段視頻，以前用 CV 的方式，很難做泛化性理解，今天的大模型在幾乎不訓練的情況下，可以很好地回答視頻裏的人在幹什麼？有沒有精彩時刻？精彩時刻在多少秒？

還有一些端側模型方面的激戰。之前在高通骁龍峰會上，智譜聯合他們聯合發布了 demo，在 8Gen4 手機上完全可以驅動一個多模态的模型實現很好的效果。并且，智譜構建了非常完備的端雲一體化的同源解決方案，可以讓用户在設備端很好地應用大模型的能力。

再比如視頻通話，大家可以一邊對話，一邊在視頻裏跟 AI 做交流。最早是 OpenAI 在 5 月發布了這個功能，但其實沒有真正讓終端用户用起來。在今年 8 月，智譜已經把這個功能全量發布在智譜清言上了，大家可以去嘗試。

而自主智能體，能夠讓 AI 自動化幫你完成多達幾十步的，甚至跨應用的復雜任務。大模型的文本模型成為你的大腦，多模态模型成為你的眼睛，自主智能體模型成為你的雙手，不但能夠幫你做思考，還能幫你做執行。

智譜也提供了一整套的方案，可以幫助開發者更輕松地訓練一個私有模型，也可以基于模型的能力快速開發一個智能應用，可以幫助大家來解決行業實踐。

大家使用模型的場景越來越多，越來越從淺水區進入到深水區——

2 年間，大家的需求從 " 有一個模型 "，到 " 模型幫忙提升產品指标 "，到今天 " 模型就要帶來業務結果 "，從各個方面來看，大家對模型的應用需求和實踐變得越來越務實，确實讓模型已經開始從智力生產變成生產力。

快速講幾個例子：

我們在汽車上可以非常好地重塑智能駕艙體驗；一些非常復雜的垂直領網域，比如公積金相關的復雜的問答，或邏輯推理等很多場景裏，或企業内部的 Chatbot 自動化的問數生成 Circle 的能力，用智譜模型都有做不錯的效果。

最後跟大家探讨一下大模型時代，企業或者個人該如何去構建自己的科技戰略。

我覺得這裏面關鍵來講四個要素：

選擇合适的基座，要構建與戰略目标和業務屬性相匹配的組織，基于場景和 AI 的能力來重新定義數據資產，并且把這些能力無縫融入到業務當中，從而來形成飛輪。

這裏面很多東西需要大家深度思考。

不管基座模型是國内的、國外的，開源的、閉源的，我覺得其實合适的才是最好的，所以這裏面涉及每一個環節的每一個問題，都需要大家自己思考。

我們也希望借助四樣能力，為每個企業構建自己科技戰略新飛輪，随着每一輪的轉動能夠幫我們沉澱更多的能力，構建更多的壁壘。

謝謝大家！

— 完 —

點這裏關注我，記得标星哦～

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~