今天小編分享的互聯網經驗:對話智譜AI CEO 張鵬:讓追趕OpenAI成為可能,歡迎閲讀。
1 月 16 日,智譜 AI 發布新一代基座大模型 GLM-4。
GLM-4 在基礎能力上相比 GLM-3 性能全面提升 60%,支持最高 128K 長文本,原生支持自動聯網、圖片生成、數據分析等復雜任務,并在多模态能力上有了長足進步。據智譜 AI 透露,在内部測評中,GLM-4 在性能上逼近了 GPT-4。GLM 模型智能體和智能體中心也在 GLM-4 發布當天同步上線。
此前,去年 6 月 ChatGLM-2 發布,去年 10 月 ChatGLM-3 發布,而去年 3 月 GLM-4 已經完成第一個版本。CEO 張鵬認為三到四個月完成一次基礎模型迭代是正常的研發速度。
去年年初,這家中國最重要的基礎模型公司定下了朝 GPT-4 追趕的目标,之後一年基礎模型繼續快速發展,Meta 把持着開源生态,領頭羊 OpenAI 拿出了 GPT-4,谷歌帶着 Gemini 姗姗來遲。基礎模型的競争者逐漸收斂到少數幾家,而觀察中國公司在其中的位置時,目前中國唯一估值超過百億人民币的智譜 AI 或許是那個錨。
在 GLM-4 發布之際,我們與智譜 AI CEO 張鵬進行了一次獨家對話。
以下為對話實錄:
什麼最重要?模型,模型,還是模型
硅星人:我們先聊聊 GLM-4 本身。智譜 AI 對标 GPT-4 去做自己的更新和演進,這個整體思路是怎麼樣的,如何讓追上 GPT-4 這件事看起來可行,并且可能還會有一些超預期的東西?
張鵬:首先肯定是模型能力方面差距的追趕,比如多模态能力,GPT-4 在 3 月份發布的時候其實已經帶來多模态能力了。我們判斷對于 AGI 來説,多模态這件事情可能是必須要去解決的,所以這個能力你必須有。包括模型本身能力提升所帶來的像 CoT 這樣的高階能力,它其實根植于你底層的基礎模型的能力。
第二件事是,有了大腦,需要眼睛和耳朵,手和腳——需要要把這些基礎模型的能力輻射出去,跟外界系統產生更密切的互動,而不是簡單的做文本和影像的輸入輸出。這個事情就偏向應用了。
硅星人:基礎模型能力的輻射,這是關于 Agent(智能體)的想法了。現在人們談起 Agent,正在陷入一個概念的陷阱裏,智譜 AI 對于 Agent 的有什麼自己的理解?
張鵬:Agent 在人工智能或者説計算機科學史上是個 " 老概念 ",有一套相對完整的解釋體系。大模型下 Agent 找到了一個新的視角。但 Agent 的本源仍然是大模型的基礎能力,大腦的智力水平足夠高,才能去談理解、推理、以及規劃和執行這些事。
智譜 AI 還是從技術角度的的定義和演進來理解 Agent 的。然後從大模型角度來看,Agent 應該怎麼去演化,怎麼去提供這個能力。以及它跟需求語言之間應該如何相互翻譯,找到通路去對應上。
硅星人:Agent 和所謂的 AI 原生應用(AI Native App),這兩者之間是什麼關系?
張鵬:首先 AI Native 這個範疇還是太大,我們更願意叫做大模型的原生應用。
首先説大模型原生應用,它實際上是指的我們希望説從大模型的原生能力出發,去設計和開發的應用,我們期待它是一種新的東西,而不是説把原來的應用拿來做一個更新。
這個是有的,比如 ChatGPT,這個產品在工程化層面其實很簡單,核心就是一個模型。而對于 Agent,我們的理解始終是它是模型某種能力的外化,你可以把這種能力做成某種大模型原生應用。
但 Agent 本身也會給應用的開發過程帶來一些變化。當 Agent 能力被用在開發階段,它又變成一個賦能原生應用開發的過程,Agent 和大模型原生應用之間的邏輯應該是這樣。
硅星人:就是可能大模型原生能力本身體現了 Agent 的能力,Agent 某種程度上也在幫助大模型原生能力開發的自動化,這樣一種關系。
張鵬:對。
做垂直領網域最終是為了以後不做
硅星人:智譜 AI 在垂直領網域的商業化很早,給外界的感覺一直是比較 to B,GLM 模型智能體會是一個跟 GPTs 很像的東西嗎,還是不一樣?
張鵬:商業化落地這件事還是圍繞着我們模型價值本身。我們早期的模型能力不太夠,那可能就需要去為了填補模型本身的能力和最終業務需求之間的 gap,而去垂直領網域多做一點事情。
你不去做,你不知道客户在想什麼,也就不知道你的技術最終幫助客户提升的用户價值到底有多少。
這實際上是我們去尋找 Best Practice(最佳實踐)的一個過程。我們希望把這個路徑蹚通,回過頭來把這些東西沉澱下來之後賦能給生态。
硅星人:比如説 RAG(Retrieval Augmented Generation,檢索增強生成),智譜 AI 應該是國内最早把 RAG 用到垂直領網域了的一個。
張鵬:算是比較早,因為 LangChain 整個開源項目裏頭就有我們。RAG 是很典型的一個例子,就是從垂直領網域沉澱出通用型的需求,以及一套方法。這套方法可以成為一種标準化的解決路徑和產品。
硅星人:所以可以這麼理解,我們做很多垂直領網域的事,其實是為了反哺通用模型的基礎能力提升。做的目的是為了以後不做。
張鵬:對。GLM 模型智能體就是在探索一種更通用的路徑。
傳統互聯網爆款產品經理不理解最新的 AI 技術
硅星人:智譜 AI 一直以技術能力見長,你怎麼看現在智譜 AI 的產品能力,比方説我們能夠支持多少個開發者在上面,怎麼提供好的工具,甚至讓開發者能得到更多曝光?
張鵬:如果我們現在真的進入到了大模型的應用半場的話,產品能力是大家都很關注的一件事。
智譜 AI 之前也有自己的一些產品化的東西,其實用户量都還不錯,我覺得產品能力應該來説還不算差,當然我們會持續的在這方面去加強。
但是反過頭來講,你看 ChatGPT,作為一個產品本身沒有什麼特别復雜的東西。所以——我個人感覺,因為我不是做產品出身——所謂產品力這個東西,在這個時代它變成了一種對需求的敏鋭感知能力和對于新技術的領悟能力的兼顧,在這個基礎上,考驗的是如何揉合這兩種能力,去產生一種新的產品表達形态的這樣一種復合的能力。
硅星人:這跟移動互聯網時期的小步快跑、快速迭代和敏捷開發這些東西可能是不一樣了。
張鵬:這一套沉澱下來的產品開發邏輯還在,尤其是 ToC。但為什麼現在大家説要找一款所謂的 Killer App 這麼難,好像所有的產品經理都沒有頭緒。
我個人覺得其實矛盾在于,原來傳統的互聯網爆款的產品經理,他對于現在最新的技術沒辦法理解。真正懂技術的這些人,對于所謂的用户需求和產品需求又沒法理解。
硅星人:那當一個基礎模型開始面對開發者了,也就存在一個模型的技術和產品适配問題(technology product fit)。你們要如何跟開發者去講,你能夠做什麼不能做什麼?
張鵬:好像現在只能開發者自己去嘗試,但在這之外,其實有一些本質的東西做產品的人可以在間隙思考一下。
回到第一性原理,大模型本質上解決了什麼樣的問題,找到這個點,然後你把你所有需求寫出來,然後你去找到這兩者間的連線。
比如我反問你,Chatgpt 解決的是什麼問題?你第一天用上,它就直接告訴你這是個不一樣的東西,從來沒有人想過這個問題——雖然他幫你解決了很多問題。
硅星人:所以 ChatGPT 解決了什麼問題?
張鵬:我個人認為它最本質上解決的還是人機互動的問題。機器終于有一天能夠比較像樣的能聽懂人説什麼,然後説出來的話也讓人能聽懂。這個是個本質的問題,它彌合了人和機器之間的距離,這是他第一性要解決的問題。
順着這個思路,哪些場景可以被這件事情解決掉,很容易判斷出自動客服這類的需求。
這是大模型解決的第一件事。第二是大模型在經過大量語料數據訓練之後,具備超越一般人積累的知識和數據量,能很好的去解答人們日常生活當中的問題。這件事本質上解決的是我們人類社會當中人與人之間的信息和知識傳遞的成本和範圍問題。
硅星人:那些讓人被迫為了一份工作要學習一堆無用知識的問題,或者説是知識的快速消化的處理的問題,現在都可以處理了。
張鵬:對,我有更低的成本,更大的範圍去獲取知識了。所以這個事情又可以 cover 掉教育、員工内部培訓這些事情。所以如果按這種邏輯分析方式的話,其實還是能找出來一些大模型應用產品具體的方向的。
硅星人:那這樣其實對做產品的人的要求是非常高的。過去互聯網時期中國的產品經理群體裏,設計師出身的人很多,做互動做 UI 的人很多。那時候美國的產品經理,一看全是 MBA 背景。那時我們會嘲笑這幫人做 MBA 的怎麼做好產品,現在你發現還真得靠 MBA 去做產品經理。
張鵬:對,我特别贊同你這麼説。這背後其實是大家在對于 " 一個產品需要滿足什麼需求 " 這件事的着眼點不一樣。
設計美術出身的產品經理居多,是因為我們認為移動互聯網是一個注意力經濟,我要做到的事情是抓用户的注意力,只要有人關注它、點開它,我的目的就達到了。因此整個產品、招的人也都會圍繞這個目标構建。
如果更在意的是整個互聯網經背後的經濟邏輯和價值邏輯,那就不會是這樣。
生态好才是真的好,不要在摩擦中消耗力量
硅星人:再度回到 GLM 模型發布的智能體,智譜 AI 希望給到開發者或者第三方怎樣的一個開發環境。現在有兩種方向,一種是往開發平台裏邊去堆各種各樣的工具和能力,降低開發門檻,吸引更多人。另一種就是 OpenAI 這樣只提供一個很簡單的 instruction,反正我有什麼你都知道。
張鵬:我們比較接近 OpenAI 那種思路,首先還是強調基礎模型本身的技術能力。模型能力足夠強,你才有可能讓大家真正用起來。
在這個時間發布智能體,還是因為我們覺得我們模型的能力到了這個水平了,所以就開放給大家。至于工具是可以慢慢增加的。問題的根本并不在于説你工具多少,工具少的時候我能解決少的問題,工具多了能解決更多問題了。
硅星人:國外 OpenAI 已經通過 ChatGPT 走向大眾了,國内一些入局大模型的大廠有自己的流量資源優勢。目前智譜 AI 的姿态仍然是面向業界的,有沒有想過轉變成真正的面向公眾的一個 AI 品牌,這個問題重要嗎?
張鵬:首先這個事兒我認為還是挺重要的,我們有我們自己的理念和終極目标,但這個過程當中,作為一個創業公司要活得好,其實還是比較依賴一個良好的生态,生态這個事情就是需要去發聲,需要跟大家去講我們怎麼想。
做一場 DevDay,做很多活動,一是希望大家多互動,也是希望把生态發展的理念傳遞給大家。大家好才是真的好,很多時候我們在摩擦中消耗了太多力量了。
硅星人:那再進一步,智譜 AI 有沒有可能成為一個面向世界的,而不是僅僅是面向中國的 AI 公司 ?
張鵬:我們沒有給自己設這個限制。智譜 AI 的目标是要做到全世界最好的水平,我們做的所有事情都是朝着這個大目标去的。