今天小編分享的科技經驗:8.23 中國大模型「頂流群聊」筆記,歡迎閱讀。
國内的科技創新歷史上,從沒有哪一次像大模型技術這樣,短短幾個月就建立了「科技圈共識」。
我 1998 年入行科技圈,見證了 PC 時代、互聯網時代、移動互聯網時代這幾個時代變遷,從來沒見過這麼迅猛的「共識達成速度」。就拿極客公園的創業者社區 Founder Park 來說,因為比較早關注到大模型領網域的技術變化,在短短 4 個月時間就新增了 15 萬關注者,社區成員已經擴充到七八千人之多。
就在昨天,首批國產大模型通過備案,又點燃了人們的熱情。備案制管理,意味着對大模型發展的政策上的寬松,這也意味着大模型在國内的商用和產業化将真正開啟。
只不過「共識」達成的太快也會有讓人擔心的地方,因為這個技術還在早期發展階段,也還做不到「水銀瀉地」般落地到廣泛領網域。
客觀地說,如果相信大模型技術帶來了 AGI 的曙光,那麼就要坦誠看到其真正產品化,并成為生產力,現在才算開始探索。那些在一線的創業公司經歷的 KnowHow 和問題,恰恰是最值得被匯聚起來的星星之火。
基于這個想法,阿裡雲聯合 Founder Park 邀請了 20 多位中國大模型領網域模型層、工具層、應用層的優秀創業者,到杭州西溪溼地做了一場面對面的閉門交流。
阿裡雲董事長張勇還給這場閉門會取了一個很好的名字——「西溪論道」。這場長達五個小時的閉門會,張勇就坐在我旁邊,全程參與到創業者的群聊,我看他筆記就寫滿了好幾頁紙。
8 月 23 号,西溪論道參會者合影
看得出來,阿裡雲作為算力基礎設施層應該如何與這幾個層面連接與共創,如何支持各個層面的創業者做好大模型用好大模型,這是張勇最關心的話題。這顯示了阿裡雲跟國内其他公司完全不同的姿态,如何促進大模型生态繁榮才是阿裡雲最關心的事情。
這些堪稱國内大模型領網域最積極最活躍的力量,從下午兩點一直聊到了晚上九點,從產業的多個層面,立體地做了交流碰撞,也從各自的最新實踐中聊出了很多有洞見的觀點。按照他們的說法,在這裡一起讨論,聽到了很多真話,很多「真情實感」。
我整理了一部分印象深刻的要點,用這篇文章也分享給大家。
01 關注大模型,更需要關注 infra
現在全球任何一個地方,做大模型,最稀缺的資源除了人才,就是 GPU。
百川智能創始人&CEO 王小川分享他去矽谷和朋友聊到,英偉達一年的 GPU 出貨量在 100 萬顆,但 OpenAI 說要設計 1000 萬顆 GPU 連在一塊的超算。
所以 GPU 到底多少算夠,有限的算力有解嗎?
創新工場董事長、零一萬物創始人李開復表示,盡管千萬張 GPU 是天方夜譚,但是「大力出奇迹」的暴力美學是有背景的。強化學習之父 Richard Sutton 在《The Bitter Lesson》(《痛苦的教訓》)中指出:過去七十年,想在 AI 裡放一點知識進去,想要增加一點能力,想調一調模型架構,最後發現基本沒有價值。唯一推動過去七十年 AI 進步的力量,就是一個通用且可擴張的計算能力。計算能力增強了,相應地帶動算法、帶動數據的進步,這是大力出奇迹的背景。
因此,在這波大模型浪潮中跑出來的公司首先要有算力,幾個人、幾十張卡的「禀賦」,還是去選擇調用中心化的大模型可能更務實。
「當有了相對足夠的算力,在這個前提下好好利用算力,可以做出很多今天只用開源、只調 Llama2(Meta 的大語言模型)做不出來的東西」。前有 OpenAI 不計成本地設立模型新标杆,後有 Meta 開源為所有人鋪平道路,在風雲詭谲、高度不确定的大模型創業環境中,這是李開復對大模型公司新目标和新實踐的思考。
這個打法是什麼?怎麼讓一塊 GPU 發揮兩塊、甚至三塊的能力?這個問題可能要在團隊構成上更加講究。李開復認為,Infra(硬體底層)團隊必須比 Modelling(模型)團隊還要強大。他說很快大家就會發現,做過大模型 Infra 的人比做大模型的人還要貴、更稀缺;而會做 Scaling Law(擴展定律,模型能力随着訓練計算量增加而提升)的人比會做大模型 Infra 的人更稀缺。
因為優秀的 Scaling 團隊可以規避徒勞無功的訓練,當做訓練的時候,大概率會成功,一旦不成功,也有能力馬上叫停,有足夠的數學能力來做這件事情。除此之外還有很多微妙的細節和經驗,比如,讀通論文也會少走很多彎路,因為有些論文是故意把不奏效的東西寫出來,不會讀很容易被帶偏。
其實客觀來看,GPU 短缺這個問題,不只是中國創業者的問題,全球創業者都要面對。所以怎麼把有限的算力做好,會成為大模型公司角逐的關鍵。
李開復就提到一個明确的觀點:大模型團隊每一個位置都要有人才,Pre Train(預訓練)、Post Train(訓練後)、Multi-Modal(多模态),Scaling Up(可擴展性),Inference(推理)等等都有其重要性。其中,Infra 團隊這部分人才更稀缺,更應該被重視。
其實除了創業者自己對大模型要精進更深入的理解,也需要更多維度的技術創新,比如現場一位 infra 層的創業者,墨芯創始人&CEO 王維就分享了一個計算上的解決方案——稀疏計算。讓我看到了雲端和終端 AI 芯片加速方案通過優化計算模式,能将神經網絡開發全面稀疏化,提供超高算力、超低功耗的通用 AI 計算平台的可能性。
02 ChatGPT 點燃熱情,Llama2 讓人腳踏實地
如果說 ChatGPT 點燃了很多創業者的熱情,那麼Meta 開源的 LLaMA和 LIama2,就讓絕大部分創業者在基礎模型的起跑線上「眾生平等」了。但未來朝着什麼方向發展,創業者根據自己的資源禀賦、能力結構,顯然會有不同的使命和願景。
對于仍選擇做基座大模型的創業者而言,開源的底座只是起點。李開復就指出,盡管在跟 GPT-3、GPT3.5 等 SOTA(state of the art,先進)模型的各種評比中,Llama2 的差距不大。但實際上用起來,今天 Llama2 的能力跟 GPT-4,以及 Bard(谷歌的大語言模型)的下一個版本,差别巨大。
圖片來源:Meta
這看起來也給了做大模型的企業一些騰挪空間,在未來,「真有錢」、「真有本事」的大模型創業者,有機會切換到一個 New Bard 或者 New GPT-4 的打法。
另一方面,不少創業者表示,Meta 開源帶給業界的觸動很大,「今天 xxx 可能還是中國最好的模型,但明天它可能就被超越了。甚至突然有一天會發現你原來練的那些模型基本都沒啥用,當技術換代或者更強的開源模型出來,過去的投入可能完全「打水漂」,比如開源模型在預訓練上看了一萬億的英文 Token,你自己的模型非要再看一遍,可能毫無意義。」出門問問創始人&CEO 李志飛認為,要充分看到開源帶來的深遠影響。
「大家雖然都有偉大的理想和抱負,但取決于是否有足夠多的經費來支撐到那一天。所以要腳踏實地得看到那,活着可能比什麼都重要。」瀾舟科技 CEO 周明也認為,很多原先想做「最好大模型」的企業,其實需要重新思考創業的生态位,選擇擁抱開源,在開源的底座上做「為我所用」的東西。比如英文開源的模型在中文能力上較弱,也沒有在行業場景、數據中打磨過,這恰好是創業團隊的機會。
在這一點上,瀾舟科技把開源模型當 L0 底座,在這之上,做 L1 語言模型、L2 行業模型、L3 場景模型。周明認為,這樣一層一層做好,跟客戶通過 AI Agents(代理)來互動得到反饋,模型一點點迭代,會逐漸建立壁壘。即便未來有更好的開源模型出現,也有辦法在它的基礎上再重新訓練或繼續迭代。「開源模型『水漲船高』,你随着比你厲害的人的成長而成長。」
用好開源模型,也是一種壁壘和門檻。這可能和很多人想象的不太一樣。甚至有人會問,基于開源模型做,還算做大模型嗎?另一邊,很多企業自身也避談使用了開源模型這一話題。
其實,基于開源模型做,後續的投入門檻并不低,能力要求也不低,用開源只是有效降低了冷啟動的成本,對創業者這并不丢人。比如李志飛分析認為,一個開源模型可能看過 1 萬億 Token 的數據,幫你省了幾百萬美金,模型廠商需要接着再往下訓模型。最終要把模型做到 State of the art(SOTA,特指領先水平的大模型)的水平,數據清洗、預訓練、微調、強化學習,各個步驟都不能少,每年算力可能千萬美元起,并不見得一下子門檻就沒了,更不是使用開源模型就不用繼續投入了。
從這個角度來看,開源模型是更務實的選擇,優化、訓練出實用的模型反而也是真本事。基于開源,有機會做出很好的大模型,核心是能夠擁有相對領先的認知,有持續迭代模型的能力。
03 大模型 ToB 現狀和實踐
模型能力的提升是一方面,落到客戶場景,又是另一回事。
從客戶的角度來看,大模型,「大」并不是唯一的追求,甚至完全不一定是客戶想要的。
有創業者就分享了特别現實的客戶場景:真正去跟 B 端客戶談,客戶只需要語言理解、多輪對話和一定的推理能力,其他的 AGI(通用人工智能)能力一概不要。
客戶向他反映說,其他功能反倒帶來了麻煩,「幻象」(Hallucination)問題解決不了,而且客戶原本有很多 AI 1.0 的模型,本來用得好好的,為什麼要扔掉不用,AI2.0 并不需要覆蓋 1.0 的能力,能合理調用就挺好。這也解釋為何在國内外 RPA 領網域是引入大模型最積極的。來也科技聯合創始人&CEO 汪冠春今年在國内市場也驗證了客戶有這方面的明确需求。
這種情況下,只要把自然語言理解清楚了,把參數傳過來調用 AI 1.0 的模型以及外部數據庫,結果是可靠的,成本也比較低,最後再用大模型把結果組裝起來,形成一個報告。模型在這裡起到了任務分發的作用:抽成子任務、每個子任務調用什麼。在子任務裡,有些大模型支撐的,有些是原來的統計模型,有些甚至都不是自己的,而是某個第三方的模型,客戶最後要的,只要能完成任務就行。
嘗試找到這樣的 PMF(Product Market Fit,產品市場匹配)後,如果只做這種 To B,其模型能力包含語言理解、多輪對話和少量的推理,這個模型并不需要很大,100 億到 1000 億的模型,就相對夠了。相應地,需要在幾百張卡的基礎上,把語言理解、多輪對話做好,并且有一定的推理能力,再加上 AI Agents,基本上能完成客戶在很多場景下的需求了。
一個通用的大模型,并不意味着可以解決所有問題。B 端客戶的很多場景,通用大模型放上去并不奏效。這意味着模型需要越來越多,有越來越可收斂的場景,也意味着需要更多力量參與進來幫助技術和場景的對齊,而不是一個萬能的技術去适配所有場景。
瀾舟科技 CEO 周明認為,必須要把用戶數據、行業數據,甚至圖譜或者規則,放到模型裡繼續訓練,這是行業大模型存在的必要性。在通用大模型不能覆蓋到的局部行業,加入這樣的數據,能把行業問題解決得很好,而且還能克服很多幻象問題。
我記得李志飛也補充了這一視角,他認為,通用大模型與垂直大模型,各盡其用,魚與熊掌不可兼得。模型特别大,就意味着推理成本非常高。而且,一個做芯片設計的大模型,去回答電影、明星等娛樂内容,也沒有意義。他認為,To B 更多是要垂直和可靠,而通用在于智商,有很強的推理能力、邏輯能力,很豐富的知識。這不一定是 To B 目前階段需要的。
與此同時,國内各行各業對于在業務中加入大模型的需求,是非常強烈的。藍湖創始人&CEO 任洋輝,和 Moka 聯合創始人&CEO 李國興,這兩家 SaaS 公司產品接入大模型後,已經得到了客戶的認可,真正收到了錢。
通過對這兩位創業者從 2、3 月份到 7、8 月份的狀态變化的觀察,我發現SaaS 領網域中越早看到大模型帶來的技術變化是「重新定義軟體」級别的,敢于拿出「向死而生」的思維來實踐這個「重新定義」的進程,基本上幾個月就會破除焦慮,并且讓人看到希望。
所以,手裡拿着客戶和場景的創業者,搞不好會是那些大模型創業者的更早獲得技術紅利的受益者。
因為落到具體場景下,大模型其實就會有不一樣的追求。比如華深智藥創始人&CEO 彭健表示,大模型帶來的幻象(Hallucination)對藥物設計這樣的 AI for Science 領網域可能是有益的,某種程度上,所謂幻覺在某些領網域就是智能的意義所在,因為這可以幫助設計出人想不到的蛋白質組合方案。
就像智譜 AI 作為國内大模型落地案例跑得最多最快的一家,其 CSO 張闊在實踐中就認為,對未來大模型的價值來說,「20% 可能是中心化的,80% 會是非中心化的」,也就是說用更豐富的、更多種類的大模型具體到客戶場景裡去產生價值,而不只是一個大模型無限泛化能力去解決所有問題,這是一種必然的趨勢。而這也得到了一起交流的很多創業者的認同。
04 AGI 值得獻身,但也不要「玩命」
大模型是 AI 的一個分水嶺。過去,人工智能是在封閉的系統追求确定的目标,比如人臉識别系統追求百分之百準确,但現在,大模型帶來的「湧現」是一種開放的智能,產生各種各樣的可能性,超出設計者預料之外,這是智能真正的特點,也是人工智能六七十年來最大的一個變化。
出現這樣一種新的智能系統之後,未來大家都能很便利地、低成本地地獲得智力,就像電力革命一樣。
智源人工智能研究院院長黃鐵軍認為,這次技術變革向下傳遞得很快,從大廠到創業公司迅速共識:這是一個新時代的開始。在這個時代不幹點啥,好像對不起這個時代,對不起技術的發展。
而 4 月份下場的百川智能算是目前國内做大模型最「卷」的一家,保持平均 28 天發一個模型的節奏,百川智能創始人&CEO 王小川雖然不承認自己在「卷」,但他分享了快速落地的法門:比如搜索技術有積累的團隊,對數據處理問題上是有很大幫助的。而且通過引入搜索增強、強化學習,以及其他配套性的全棧技術,确實可以來幫助模型做得更好。「如果看一下現在場内技術公司的高層背景,你會發現很多技術做的不錯的都有搜索背景,這裡面體現了一些技術的邏輯正在逐漸被看清楚。」
不過黃鐵軍認為,從科研角度來說,我們依舊只是進入一個偉大時代的早期,如果類比電力時代,今天這樣一個智力時代,其實就是當年法拉第搞發電機,一旋轉,電流產生了;現在是用大數據訓模型把智力訓練出來了,這是一個階段。後邊我們還需要一個人——麥克斯韋,因為後邊電磁學的确立,才是電力在人類社會開始靠譜可用、并推動工業革命的前提。
今天的大模型還有很多東西是黑匣子,一方面大模型的「上限」還有巨大提升空間,AIGC 很多時候能帶來巨大驚喜,但另一方面大模型的「下限」卻還不能保持足夠穩定,這個時候理解技術的邊界,合理的設定目标和要解決的問題,是很有必要的。有人要解決上限的探索,有人要解決下限的穩定。
對創業者們來說,AGI(通用人工智能)曙光已經出現,這是一件值得投身的事業,但也不要「玩命」。
圖片來源:視覺中國
另一邊,除了等待大模型技術更進一步,很多中間層的創業者在改進讓大模型落地到應用的環境。
BentoML 亞太區負責人劉聰稱,和之前傳統機器學習相比,海外客戶基本都能拿到一些預算來做大模型相關的產品原型或者 Demo。但現在還沒有進入生產環境,去為公司產生商業價值,而很多做中間層的創業者看到了這個機會。
Dify.ai 創始人&CEO 張路宇的創業洞察也正源于此,他說,在開發者視角,拿到模型是不夠的。他分享了一個數據,在對六萬多個應用的樣本做分析後,發現現在投產或者接近投產的,這個比例差不多是 5%。有對模型技術不是很滿意的,也有團隊工作流還沒有适應 AI 應用開發的。相應地,張路宇團隊針對現在投產可能性更高的應用,去做一些專項能力。比如他們有一個指标叫消費者摩擦度的改進,看 AI 在這件事上能提供多大的價值,提供相應的能力。
Zilliz 創始人&CEO 星爵補充了這一視角,他認為一個極度簡單的開發棧,是AI民主化的一個前提,基于這個判斷,他提出了 CVP(大模型+向量數據庫+提示詞工程)這樣的開發棧。
05 如何通向 AI native?
什麼是 AI 時代的的 Killer App(殺手級應用),在今年 3 月微軟發布 Copilot 之際,很多人的好奇被瞬間點燃。但在這次閉門會上,李開復提出了一個不同的視角,Copilot 不算是 all in 大模型的產品。
他認為,從移動互聯網最成功的產品之一微信來看,放棄 compatibility(兼容性)很重要。做得最早的是 MSN、QQ,但是勝出的是微信,因為張小龍做了一個決策,既然是移動互聯網的時代,就不要 PC 了,微信在早期專注在移動互聯網的特質上,百分百押注到新的技術平台上。
從這個視角看,AI native(AI 原生)的應用可能有這樣的特征:如果大模型拿掉了,應用就崩潰了,它是一個完全依靠大模型能力的應用。但拿掉 Copilot,Office 軟體還是 Office,AI 只是錦上添花。
這一觀點得到了現場創業者最多的認同,也引發了大家帶着這個定義,對 AI native 應用的探讨。
前段時間爆火的產品妙鴨,其產品負責人張月光認為,沒有大模型,就沒有妙鴨,這跟李開復對 AI first,AI native 的思考一致。
他認為,妙鴨作為率先出圈的應用,最重要的是解決了可控性。妙鴨團隊一開始沒有想打底層模型的工作,更關注怎麼才能用現存生态上開源愛好者開發的各種插件和小模型做可控性。錨定了最重要的事情是可控性,妙鴨把照片質量做到平均分 90 分以上,也迎來了快速成功。
「我們在應用層特别關注怎麼才能讓模型更可控,就發現在影像賽道上,已經有一些相對可控的技術了。可能語言賽道上,如果出現這樣的東西,會對上層應用創業者是一個質變時刻」。張月光的實踐給了做大模型應用的公司一些啟發,可控性可能是 AI native 應用誕生的條件。Stability. AI China Lead 鄭屹州也觀察到了這樣的趨勢,開源社區貢獻者解決可控性後,大量應用冒出來了。
在探索新一代應用上,元石科技創始人李岩指出,大模型帶來的推理能力,是新一代產品的本質不同。
而社交+Agent 是被看好的一個機會,并且一定會是最早一批 AI native 的產品,但這很可能需要創業者具備從大模型到產品的「端到端」的構建能力。比如,李志飛分享了和 Character.ai 探讨為什麼後者要做自己的大模型時,對方表示,因為用OpenAI或者谷歌這樣的中心化大模型,不會回答「調情」的問題。這是 Character.ai 找到的獨特空間,也是可以逐漸積累的壁壘。
同一領網域的聆心智能,在做社交大模型的應用上,發現了獨特場景。聆心智能 CEO 張逸嘉分享了他們看到的與預想的不同,現在大模型可以落地的社交場景不是陪伴,人們接受虛拟形象的陪伴需要時間。現在落地的社交場景是角色扮演,用戶畫像是網文小說愛好者,角色扮演是網文小說的新形式。
至于現在最新的 AI Agent 方向,是不是大模型「全村的希望」,甚至最終帶來互動革命、終端革命、商業模式革命,很可能要取決于多模态能力的發展。
心識宇宙創始人&CEO 陶芳波解釋說,一開始大家對 Agent 的期待很高,但在現有技術條件下發現,Agent 怎麼樣比 ChatGPT 解決了更多問題,很難被講清楚。他認為,如果真的要把 Agent 發揮作用,并不是把那麼多軟體的 API 給接進來,因為接軟體的 API 本質上是在做兼容,是新瓶裝舊酒。
Agent 有沒有一些更加 Native 的形态去完成最後一公裡。有很多很多要做的事情,數字栩生創始人&CEO 宋震說的空間感知能力和多模态能力。在這些條件成熟之後,可能就會出現 Killer Case。
李志飛堅定地認為,現在看來,多模态是 C 位,不是花瓶。因為Agent 輸入輸出都依賴于多模态的能力,沒有多模态就沒有 Agent,只不過今天的 Agent 更多是通過語言模型,通過文本來反饋,但是最終 Agent 會是一個多模态的觀察、感知、行動。他預判,跨模态知識的遷移,再過兩、三年看,反而是大語言模型最大的一個貢獻。
06 大模型時代,服務大 B 還是小 B
幾個月前,我在舊金山正好趕上數據公司 Databricks 的開發者大會。這是一家專門做「數據湖」的數據平台公司,可以說是長在雲計算平台上的「中間層」公司。就是這樣一個公司,幾年時間估值已經達到幾百億美元,并且還在持續增長。Databricks 的客戶既有大企業,也有小創業公司,大小通吃。
今年,這家公司迅速接入大模型,還收購了大模型公司 Mosaic ML,開始幫助客戶落地大模型進入業務,這個風口讓它眼看一路狂奔千億美元價值而去了。
我當時非常好奇的一點是,為什麼國内好像沒能長出這樣一個基于雲計算的「中間層」公司,而這一波 AI 技術進步的變量,是否在中國能催生出這樣一批在把雲的算力變成業務競争力,帶給更多行業數字化進步的「中間層」的優秀企業?
阿裡雲董事長張勇認為,「中間層」公司的出現,一定是有可能的,也是雲計算企業樂見其成的。但這些公司要解決的還是一個核心問題——定義清楚要解決誰的什麼問題,定義越清晰,能力越到位,做的東西就能真正「收斂」,真正有商業「穿透力」。
這也引發了參會創業者們的探讨,比如大模型技術剛剛開始進入行業,但企業服務「不收斂」、項目化的問題就開始出現了。比如給 B 端用戶做大模型訓練,但由于數據是對方的,所以最終合作完,自己的團隊很難「閉環」——數據沒有飛輪,收入毛利也低,一不小心就做成了「高科技施工隊」,是技術企業面對 B 端的一個通病。甚至有創業者都開始懷疑,大模型 To B 可能天生缺乏土壤。
但加入創業者群聊一直在做筆記的張勇,恰恰在這裡很體系化地說了一個不同的見解:「To B 其實還有另一種可能,就是「小 B」,也就是那些中小微企業,它們看起來不起眼,但是數量眾多,單單服務它們,就能夠造就現在的互聯網巨頭。」
例如,阿裡早期的「黃頁」,讓中小賣家能被外國買家看見,帶來了跨境貿易的繁榮;淘寶則是解決了信息和物流的流通問題,就成就了電商這一大品類。
而且,相對于大型公司,這些小 B 公司并不關心技術和願景,誰能幫它們解決增長問題,就會因此付錢。
當前大公司的數據化,最主要的一個目的就是要「降本增效」,說白了就是「節流」。但效率優化空間總有盡頭,可是增長和發展的「開源」空間,卻相對無限。張勇認為,企業服務裡「開源」遠比「節流」重要,人們永遠願意為了發展而付費。
他甚至認為,過去數字化企業服務過于看重「降本增效」可能是個誤區,因為願意為提升百分之幾的效率付錢的往往是大公司,他們體量大,這種提升符合投入產出比。然後也讓大家都圍着大公司做項目。但反過來,小公司很難靠「降本增效」去啟動需求,它們要的是成長和發展的能力。
其實,小 B 客戶還有一種雙重性,即如果采用「訂閱」的方式,那它其實就可以被看成是一個「C 端用戶」。
在這一點上張勇的觀點也得到了參會創業者的認同,比如出門問問的李志飛曾經在語音識别領網域做過 To B 的業務,被同行卷得非常痛苦。而後來他做的 AI 配音工具「魔音工坊」,服務的就是一個個内容創作者,收斂到一個真正解決小 B 們普遍問題的產品,這些「小 B」反而讓他真正把 AI 技術變成了健康成長的業務。
張勇還建議創業公司需要一開始就确定自己要服務的客戶,是 C 還是 B,是小 B 還是大 B,必須定義好。張勇甚至覺得,做 AI 的公司,如果既做 To 大 B 又做 To 小 B 甚至 To C 是行不通的。
雖然 AI 技術的發展帶來了很多變化,會越來越有通用的能力,但是在技術層面之外,還有組織的「DNA 問題」,「你一個公司裡做大客戶的和做互聯網用戶的團隊,上班的着裝、說話的方式可能都是不一樣的。」張勇覺得要定義清楚自己服務誰,解決什麼問題,而不是哪有單子往哪裡走。
07 大模型對雲意味着什麼?
幾年前上一波 AI 浪潮中,很多創業公司一樣獲得了大量融資,出現了很多知名公司和創業者,但是幾年下來,依舊做得很辛苦。我和很多那一波創業者一直保持交流,好多次約出來聊天,看到他們一臉疲憊沙啞着嗓子,一問往往是前一天陪某個大客戶喝了大酒還沒緩過來。
這次的很多創業者也目睹了那個時代,技術最終因為無法形成标準化產品,變成只能接項目的「高級人力外包」、「高科技施工隊」。他們都覺得,一定不能再重蹈覆轍。
與此同時,大家也很關心阿裡雲這樣的雲計算平台在大模型時代會面對什麼變化。大家也問張勇,在大模型時代,他覺得雲本身到底是技術,還是產品?
張勇的回應倒是很直接,「雲本身應該是產品,并且不是一個,而是一系列的產品。」在大模型和 AI 浪潮推動下,有一個事情是确定的,就是行業和客戶對算力提出了全新的要求。如何滿足客戶對算力的進一步需求,就成了阿裡雲的基本出發點。張勇覺得這裡面一定有技術要解決的問題,但阿裡雲也一樣要思考如何「收斂」到真正解決產業生态問題的產品,而不只是輸出算力本身。
有意思的是,這次交流活動雖然是 FounderPark 社區和阿裡雲聯合邀請,但卻沒有安排任何關于「通義千問」的分享。創業者們當然也很關心雲平台自己做大模型的目的。張勇的觀點是:這個容易出現 Hyper Scaler(超大規模玩家)的跨技術時代,肯定沒有人敢掉隊,不可能不去觸摸技術本身。但他覺得,阿裡雲在這樣一個巨變時代,要把握的還是更核心的角色,就是Cloud Service Provider(雲計算服務提供者)。
「而要做好這個角色,不懂大模型一定是不行的。」張勇說:「我們如果不做通義千問,可能都搞不清楚該如何幫助今天參會的各位創業者們。」
其實讓張勇比較興奮的,是他非常确定未來人類社會對于對算力的需求是無限的,對于其效率的要求也會越來越高。所以張勇說,阿裡雲肯定是希望「模型越多越好,場景越多越好」,二者越多,對算力的需求和技術要求就更高,這就意味着雲有了新的要去面對和解決的問題。而唯有持續不斷值得解決的「難問題」,才能驅動雲的價值有更大的成長空間。
「雲計算平台前所未有需要一個生态,而不是什麼都自己搞。目前,還沒有一家公司能把芯片、雲計算、數據平台、機器學習框架和大模型,全部用自己家的,形成所謂的「閉環」,這幾乎在物理上是不可能的。」
張勇覺得,AI 技術的發展,讓生态有了新的可能。他有個遺憾,過去十年是中國雲計算突飛猛進的時期,但中國的 SaaS 行業,并沒有因為基建的快速發展而有了本質性的提升。而美國的 SaaS 公司,目前都在探索将 AI 嵌入到平台中更新,走了一條和國内公司不同的路徑。
他認為,在 AI 時代,中國可能會出現新一代的 SaaS,會是一種全新的智能服務,和以前 SaaS 流程驅動不同,這種新的服務會通過數據和智能驅動,可能也不叫 SaaS。
面壁智能董事&CEO 李大海指出,國内 To B 市場非常碎片化,這是 SaaS 服務起不來的原因。但是現在有了大模型這樣一個技術變量,能不能夠形成一些變化,這是比較值得期待的事情。同時他也期待阿裡雲這樣的雲廠商,能在這裡有一些好的方案和底座,帶着大家一起把這個事兒趟得更平。
在張勇看來,中國過去不少 SaaS 公司,到現在也不能安全算是 Cloud Native(雲原生),而對于一個天然生長在雲上,或者是 intelligent native(智能原生)的新型服務,有機會「平替」之前非原生的上個時代產品。
很多時候我們感嘆,上一個十年中國的 SaaS 行業成長不盡人意,但大模型如今給創業公司提供了新的機會,在一個全新的數字化生态裡塑造新的格局的可能性。張勇的結論是:這樣的機會和挑戰,對阿裡雲,對所有創業者,都是相通的,都要面向未來找到自己的位置,共同形成生态夥伴關系,共同創造價值。
以生态著稱的杭州西溪溼地|來源:視覺中國
好了,以上是我在長達 7 小時交流中節選的一些筆記。我最強烈的感覺是,今天大模型技術帶來的時代變化,才剛剛拉開帷幕。經過前半年的極度興奮和「過度想象」,一個可能長達 10 年的技術革命,現在才真正開啟「萬裡長征」。狂熱期之後真正進入拓荒期,這裡面經過足夠時間磨練和付出堅實代價才能獲得的「共識」,才是真共識。
希望創業者之間,產業生态之間,能有更多的帶着「開源精神」的坦誠交流和思考碰撞。其實張勇給這次交流起的「西溪論道」這個名字就挺好的。坐而論道,更要起而行之。
我想,這個「道」應該就是 AGI 時代從技術到產品,從 vision 到價值的那個「創新之道」吧。