對話聯想創投宋春雨：相信萬億參數、多模态是通往 AGI 的最佳路徑

今天小編分享的科技經驗：對話聯想創投宋春雨：相信萬億參數、多模态是通往 AGI 的最佳路徑，歡迎閱讀。

一年多來，宋春雨頻繁跟他見到的創業者說，「你們這些做人工智能的專家（包括工業界、學術界），如果這個時代不去做 AGI，就是枉費人生！」

這位在聯想創投專門負責看 AI 的合夥人，旗幟鮮明地稱自己是「技術信仰派」，跟朱嘯虎這樣的「現實派」不是一類人：比如，他堅信基礎大模型才是戰略制高點，未來超級應用 95% 的能力都來模型本身；他堅信開源模型追不上閉源模型，用單一集群萬卡訓出來的萬億參數多模态大模型才是通往 AGI 的最佳路徑；他并不太在意「商業化賺錢」，認為 AI 公司的首要目标應該是跟上 AGI 的技術創新。

這種觀點在當下的投資人裡并不常見。大模型是難以算過賬的商業模式，前期資金消耗無止盡，但模型效果、領先性并不确定，且其商業化路徑還不明朗、成本收回遙遙無期。對于身處資本緊縮環境的投資機構來說，它們很難支持這麼昂貴、不确定的生意。宋春雨也承認這一點，他說多數人要算 revenue（營收），自己是絕對的「少數派」。

然而，一個矛盾不由得浮現：既然信仰基礎大模型，為什麼不出手？

在大模型火熱的這一年多時間，宋春雨沒有投任何一個基礎大模型公司，而是投了一些垂直模型、開源社區、上層應用，以及算力芯片公司。對此，他的解釋是，需要時間看清楚，哪家大模型團隊更有通向 AGI 的實力。「如果看清楚了，我們肯定會毫不猶豫地出手。」

那時間點會是什麼時候？他說，2024 年中國大模型競争會迎來分水嶺，這會是出手的時機。這時昂貴的估值是否能接受？他說，沒有給錢的「上限」，回報也暫不考慮，「你只能相信它，星辰大海」。

作為投科技十餘年、身處中國最老牌科技公司的技術向投資人，宋春雨累計投資超過 50 家 AI 相關企業，包括寒武紀、第四範式、深城交、曠視等頭部公司。他說，自己對技術的相信一直是非共識。

2011 年他天使輪投資曠視時，AI 還是冷門賽道，四年後 AlphaGo 才點燃風口；2017 年投寒武紀時，AI 芯片的前景尚不明朗；而 2020 年到 2022 年，中國 AI 迎來「至暗時刻」——資本不斷質疑「AI 四小龍」做 ToB 難以規模化、毛利差，市場上沒有人投 AI。但他卻加碼了 5、6 個 AI 項目，包括思謀科技、瀾舟科技、摩爾線程、此芯科技等。

這是一種有趣的選擇：在 AI 的至暗時刻選擇加注，卻在 AI 的狂熱時刻選擇冷靜。在他身上，或許能看到那些懂技術、且信仰技術的中國科技投資人在當下的選擇與顧慮。

用他自己的話說，技術出身（他最早是聯想集團的一名工程師）給他帶來的影響是，他傾向于先把一個事看透、接着選擇最好的标的。而身處一家資金充裕、對商業化回報更寬容的 CVC（企業風險投資），或許是他選擇的底氣。某種程度上，他的選擇也反映了聯想在 AI 時代的選擇。

不過他也認為，技術信仰會越來越成為投資圈「共識」，「這個世界不愁錢，缺的是最好的創業者和最好的創業公司。」無論怎樣，他所講的技術信仰和理想主義，對中國的 AGI 之路來說并不是壞事。至少，它為創業者提供了最寶貴的信心、想象力和燃料。

以下是宋春雨對于基礎大模型的技術路線、AI 各賽道的機會、以及技術周期和資本等的看法，或許能為行業帶來一些思考、碰撞。

對話經極客公園整理後發布：

通往 AGI 有多條路徑，最看好萬億參數多模态大模型

極客公園：聽說你最近一直在國外，能不能講一下你在國外看到的AI進展或者動态？

宋春雨：聯想是一家國際化公司，所以我們一直在全球看人工智能和大模型的演進過程。其實我們看到，中國和美國都在分别組織整個產業界往 AGI 走，我們堅信人類終會迎來矽基智能、新物種爆發的時刻。

從大模型的角度講，我們認為下一代大模型突破的主線就是原生多模态。大家看到 OpenAI 發布的 Sora，它不只是文生文，而是創造了一個視覺、語言完全融合的新世界。我們認為，視覺模型和語言模型會合二為一，形成一個統一的、最強大的基礎模型。

極客公園：所以你覺得，Sora 代表的多模态路線會比單純的語言文本路線更重要？

宋春雨：第一更加重要，第二更加復雜、門檻更高。

首先在數據層面，語言模型訓練的數據集是有限的，就是互聯網上人類產生的所有文本，任何一家公司如果有資源都能觸及。但在多模時代，訓練的樣本和訓練的數據要靠大模型去生成，或者像自動駕駛一樣讓機器去理解和吸收物理世界的數據。這個難度非常非常大。

其次在算力層面，多模态對算力的要求要 10 倍于文本。比如 GPT-3.5 這個水平，基本上千卡就可以了。但在多模大模型的時代，GPT-4 級别的訓練需要單一集群萬卡，這是入門門檻。所謂單一物理集群萬卡，就是說你不能把各個地方，比如内蒙、上海、西安等地的幾千塊卡集聯起來做萬卡集群，而是要一個地方的。這也非常非常難。

另外在算法方面，目前語言模型和視覺模型還是兩個框架的模型，而且多模模型沒有任何開源。這也導致它的實現難度非常大。

極客公園：你怎麼看王小川說，他不看好 Sora、也不想走多模态路線？

宋春雨：我們認為在中國的基礎大模型牌桌上，各家公司在 2024 年會圍繞自己的優勢領網域，做出分化和選擇。

比如有一類就主攻多模态、還有一類會圍繞行業的應用去做垂網域模型、還有一類企業圍繞 To C 迭代出字節抖音這類產品、還有一類就像小川這樣以語言模型為核心專注醫療垂直應用領網域等等。

極客公園：看好原生多模态這個觀點，你們是不是還算比較獨特？

宋春雨：是。我跟你分享一下為什麼，就是因為挑戰難度太大了，很多人提了可能做不出來。

極客公園：為什麼對OpenAI來說，剛畢業的幾個博士生就可以做出 Sora？

宋春雨：因為它已經有一個萬億參數的大模型，它是在一個巨人的肩膀上做這件事。但它的對手 Pika 就沒有一個萬億模型，只能在一個小模型上去做，這個能力差距太大了。

Sora 生成的「咖啡裡的海盜船」視頻｜圖片來源：OpenAI 官網

極客公園：對多模态的相信，是不是跟你們投過上一波視覺模型（如曠視科技）有關系？

宋春雨：是。我們很早就意識到，雖然大模型是從語言模型開始，但未來一定是視覺和語言統一的新架構。

包括在 Sora 出來之前，我們就知道 OpenAI 在做這個了。我們當時就推測，OpenAI 依靠萬億級超級大模型，最後肯定要秒殺 Pika 的。最後果然不出所料。

另外 OpenAI 有完整的多模态數據工具鏈，可以生成高質量的多模态視頻數據，同時其萬億參數大模型對于物理世界的理解更加真實和準确，也會幫助 Sora 的視覺效果更加真實。

極客公園：你們内部會有反對觀點嗎？

宋春雨：我們是通過去年一年的觀察，慢慢形成了這個觀點。内部也有不同的聲音，但大家最後從各個維度讨論、直到統一了思想。

極客公園：在多模态這條路線上，你們發現好的标的了嗎？

宋春雨：有一些很好的标的，我們都在做評估。

極客公園：你們會在目前排名前四的大模型公司中挑選，還是有更多可能？

宋春雨：不只是這些，比這些要多。我們那個圈子劃得還是挺大的。

2024 年中國基礎模型可能會迎來一個大的分水嶺——它的标志是，誰會發萬億模型、誰代表了多模态、誰能跨過 GPT4 的水平。這是我們投資整個大模型領網域的邏輯，聯想的 AI PC 戰略也是需要和這樣的公司合作。

基礎大模型「信仰派」，卻沒有出手任何一家

極客公園：你一直在提基礎大模型，你屬于「技術信仰派」嗎？

宋春雨：我是技術信仰派。前一段朱嘯虎談到，他不投大模型、只投應用，我們的觀點跟他是不同的，我們認為大模型就是最大的超級應用。

Sora 給全球的創業者帶來了一個巨大啟示：它僅靠應屆博士生帶領的小團隊，就打敗了 Pika 和 Runway，這是因為它站在萬億參數大模型的基礎上，才能更好地理解物理規律、生成的視頻才遠超其他家。

我們認為在未來的人工智能時代，基礎大模型才是戰略制高點。只有擁有一個超級強的大模型，才有可能誕生 Super APP，并構建數據、模型、應用的商業閉環。

極客公園：所以上層應用的價值主要取決于基礎大模型的技術？

宋春雨：如果說互聯網時代應用的本質是「連接」，比如美團是把線上和線下連接。那大模型時代的應用是「智力」，它對外輸出的是矽基智能，它 95% 的能力都在大模型裡，應用只是起到表層互動的作用。大模型本身就是矽基智能時代的 Super APP。

在過去的移動互聯網時代，字節跳動依靠一個高維參數的推薦引擎，迭代出了今日頭條、抖音、TikTok 等超級應用。那在今天的 AI 時代，我們也相信通過大模型的引擎，會出現下一個像今日頭條、TikTok 這樣的超級應用。

AI1.0 時代即移動互聯網時代，我們有「TMD」（頭條、美團、滴滴），其中頭條商業效率最高。現在 AI2.0 時代的效率理論上還将更高。

極客公園：那你是不是不看好目前一些依靠開源模型做應用的公司？

宋春雨：并非不看好，那些可能只是一個「業務」，等基礎大模型一更新，它們可能馬上就沒有太多的價值了。因為創業公司一旦收斂之後，根本跟不了萬億以上模型的創新能力。

開源模型的核心價值還是在垂直領網域，開發者可以快速優化，在其領網域形成商業閉環和應用價值，但其本質并不是基礎大模型。

極客公園：開源模型一定比不上閉源模型嗎？

宋春雨：開源一定會比閉源落後。此開源非彼開源，之前所謂的開源就是代碼，運行起來就完事了。但這一輪人工智能是，你要通過單集群萬卡把它（模型）和高質量數據訓一遍，一般的公司哪有這個能力？即使是開源模型，真正能駕馭的公司也是很少的。

所以為什麼那些公司開源，因為它知道開了也無所謂，能把開源復現、真正用起來的公司注定是少數。

極客公園：你這麼相信基礎大模型，為什麼卻一家都沒有投？

宋春雨：我們其實每一輪都在看，但我們确實需要時間去看清楚，哪家大模型團隊更有通向 AGI 的實力。目前已經在快速收斂中，2024 年會是中國大模型的分水嶺，能趕超 GPT-4 就有機會上 AGI 的牌桌，做不到的就會分化、下沉下來用開源做垂網域大模型。

一旦這些公司中有誰能讓我們看到，它具備引領中國基礎大模型的研發實力，我們肯定會毫不猶豫地出手。有時候讓子彈飛一會，也未嘗不是一件好事。

極客公園：這個時間點大概是什麼時候？

宋春雨：2024 年大分水嶺出現的時候。

極客公園：但這時候這些公司已經很貴了。

宋春雨：是很貴，估值體系非常颠覆原來的範式。當年我們投資曠視才幾千萬人民币的估值，但是現在大模型公司的天使輪可能都 3、5 億美金起，小川是 10 億美金起。确實沒辦法。

極客公園：你們有一個給錢的上限嗎？

宋春雨：我們沒有。

極客公園：那回報怎麼辦？

宋春雨：目前依然是早期，但 AGI 前景，堪比第四次工業革命。你要說回報預期真的不敢說，你只能相信它，星辰大海。

非共識的投資觀：賺錢、商業化不是最重要的

極客公園：你投了「海納AI」這種 AI 應用，背後的邏輯是什麼？

宋春雨：我覺得這類應用如果能在小模型的基礎上，快速構建對一些行業的數據獨占，是有機會的。

海納的數據不是在互聯網上能拿到的，而是要一個客戶一個客戶地合作，比如順豐、沃爾瑪百萬級員工的面試都會用到它，這個數據壁壘就構建起來了。在某些特定工種，如藍領、程式員的批量面試，海納 AI 已經可以 100% 機器代替 HR 完成面試。

極客公園：怎麼看目前的應用生态？

宋春雨：從美國來看，大模型應用正處于新物種大爆發的風起雲湧時代。A16Z 最新發布的報告顯示，按用戶使用時長、下載量排名的 AI 應用榜上，已經比半年多出了 40% 的新面孔。但由于基礎模型的原因，中國的應用還沒有到大爆發階段。

2024 年 3 月，a16z 發布了排名前 50 的 Gen AI 產品榜單。與 2023 年 9 月相比，超過 40% 的上榜公司都是新公司｜圖片來源：a16z

極客公園：現在很多投資人看好上層應用，因為它們商業化很好。

宋春雨：我們更看重的是，這些公司是否能追趕、甚至能在矽基智能時代齊頭并進。這一波的公司首先要能跟上矽基智能的創新，其次才是去考慮賺錢的事。短期的商業化只是一個參考。

極客公園：你相信技術一定能賺到錢嗎？

宋春雨：我們有信心。比如 OpenAI，它在發布 GPT3.5 之前根本沒有任何的商業化，它就一直在追趕這件事。但一旦突破那個技術點，我堅信就一定能賺錢。而且未來 AI 算力的成本會大幅下降，肯定會在其中找到一個（盈利）平衡點。

極客公園：你跟創業者也會這麼講嗎？

宋春雨：我也會這麼講。

極客公園：可以分享一段你跟創業者的講話嗎？

宋春雨：我跟大家都這麼說。無論是在工業界還是在學術界，我說你們這些做人工智能的專家，如果這個時代不去做 AGI，就是枉費人生。

極客公園：今天像你們這樣有着強烈技術信仰的大模型投資人，算是少數派還是多數派？

宋春雨：我們這麼技術派的（投資人），可能還處于一個非共識狀态。

很多人都是要看 revenue（營收）。在美國也是一樣，公司一到 10 億、20 億美金（估值）就比較難，因為投資人的壓力很大，它們要考慮商業化這些問題。

極客公園：為什麼你們會是少數派？

宋春雨：其實我做投資這麼多年，包括投上一波 AI 也基本是非共識。比如 2012 年我投曠視的時候，產業界都沒有投的。2018 年我投寒武紀的時候，當時 GPU 還很少用在 AI 上。2022 年上半年往前數兩年，那是中國 AI 的至暗時刻，當時所有的社會輿論、資本市場都質疑中國的「AI 四小龍」，做 2B、毛利不好、燒錢，整個市場沒有人投 AI。但那兩三年，我們基本上投了 5、6 個 AI 項目。

當時我們堅定投思謀，把 AI 和傳統行業深度整合起來；我們還投了周明；在大家對算力根本沒那麼認可的情況下，我們投了摩爾線程、此芯科技。都是在至暗時刻投的。

我們堅信基礎大模型是關鍵的成功要素，它需要極高的人才密度、極強的算力儲備、創始人極大的產業号召力等等，所以必定也是技術少數派。

極客公園：你們的技術信仰來自于什麼呢？

宋春雨：跟我們的技術背景有關系。

老賀（注：聯想創投總裁賀志強）和我都是聯想研究院出身，他是聯想研究院的 CTO，我是聯想研究院的研究室主任、當時負責虛拟化和信息安全。我們這種技術基因的傾向是，先把一個事看透、想明白了之後，就選擇最好的标的。

極客公園：從本質上說，CVC 對盈利性的寬容，是不是你們底氣的來源？

宋春雨：對，因為我們（聯想）的生态資源本身就是對創業公司最大的賦能，它一下就解決了商業化的大瓶頸，所以我們的考慮會更寬容。

擁有獨占數據的垂直模型和垂直應用，也有機會

極客公園：你也投了瀾舟科技這樣的垂直模型公司，這是為什麼？

宋春雨：我們認為 2B 的垂網域模型和 2C 的終端個人模型也同樣有價值。如果這些企業能圍繞模型和數據，迭代出各自領網域的超級應用，我們也非常願意投資。

瀾舟有自己獨占的數據。我覺得周明老師（注：瀾舟科技創始人）圍繞金融、互聯網營銷等的切入點是完全對的，他在這些領網域的 know-how 也很深。對标美國，垂網域模型的創新也有非常多好的案例。我覺得他是能夠跑出來的。

極客公園：所以除了基礎大模型之外，你也相信其他模型的價值？

宋春雨：未來是基礎模型、垂網域模型和個人大模型混合的一個時代。

比如 Mistral（歐洲模型公司）很典型，它做的是小模型和中模型，不是做超級大模型，它可能在垂直行業的閉環速度最快，最後會進到自己的優勢領網域迭代。

極客公園：你也投了歐洲的垂直大模型公司，也是看重數據嗎？

宋春雨：是的，因為歐洲要求數據和 AI 訓練的 infra 都要在歐盟内。大模型是先進生產力，我覺得未來大的地網域都會有自己的大模型，歐洲會出，日韓也可能會出。

極客公園：你為什麼會投兩個開源模型社區？

宋春雨：我們也是有非常戰略的考慮。那些垂直領網域的中小模型可以通過開源模型做，而閉源是衝着超級大模型去的，沒必要做這部分長尾市場。

所以未來開源肯定會占一席之地。世界範圍内這個比重是五五開，中國和其他國家有很大的區别，最終比重還沒定論。但我們堅信中國肯定有 Hugging Face（美國開源社區）的機會。

極客公園：阿裡的魔搭、百度的千帆都想做開源模型社區，創業公司的機會是什麼？

宋春雨：比如 [JJR1] 要幫客戶部署模型的時候，它們（大廠）肯定偏向于用自家的模型。創業公司會更客觀。

極客公園：大廠可以通過算力掙錢，模型社區怎麼賺錢？

宋春雨：戰略價值是最大的。你看 Hugging Face 的報表，它沒怎麼賺錢，但它是百億美金級别的戰略性公司。你看微軟收購的 GitHub（開源的代碼管理公司），它也不賺錢，但它有 300 億美金的估值。

另外我對創始人還挺有信心的，他肯定能把公司變成賺錢的，就是不要太急。

算力是唯一确定性的賽道，看好計算架構的創新

極客公園：算力是你投得最多的，這是因為它的确定性最大嗎？

宋春雨：确實算力是唯一确定性的要素，它是矽基智能時代的水、電、煤。這也是我們投資的核心關注點。

極客公園：由于英偉達芯片的限制問題，你對算力的投資是國產替代邏輯嗎？

宋春雨：倒不完全是。一方面，我們确實處于 AI 算力不足的階段，所以對于現在能提供和英偉達相等計算能力的芯片公司，我們是非常非常關注的。

但另一方面，圍繞現在大模型的特性，我們也會很關注計算架構的創新：一是算力的加速，一是超低功耗。

極客公園：你們具體都投了哪些？

宋春雨：因為我們堅信未來的智能計算會是多元異構的架構，所以各種計算架構我們都會投。包括傳統的 GPU（圖形處理器）、GPGPU（通用圖形處理單元）；以寒武紀和華為為代表的 NPU（神經網絡處理器）架構；RISC-V 架構（知名的開源指令集架構）；終端融合 NPU 算力架構。這四點應該都非常影響產業的演變，所以我們全都投資。

另外，訓練芯片、推理芯片、終端計算芯片，以及端邊雲網芯片……只要覆蓋 AI 算力的，我們都會投資。因為聯想本質是一個賣計算的公司，我們有以 GPU、NPU 為核心的新一代的人工智能超算集群，所以我們都會覆蓋。

極客公園：產業鏈有價值的你們都會投？有沒有什麼特别的篩選标準？

宋春雨：第一，算力架構能力可以對标英偉達的 A 系列（A100 系列）、算力密度和能力相當強、能支持人工智能大模型訓練的芯片，肯定是我們想投的 No.1。

第二，在核心的 IT 和架構方面有自獨到之處，能做出差異化，比如超低功耗是我們非常看重的一點。

第三，團隊要具備智能算力的長期引領、創新能力。

第四，在行業裡有過非常強的操盤能力，能夠做超級大芯片、而不是很小的芯片。這背後考驗好的制程匹配，無論是用摩爾制程、還是用先進制程。

另外，公司還要有很好的量產确定性。當然，估值也是我們看重的一個點。

極客公園：最近行業裡會提，芯片已經從過去馮·諾伊曼時代的存算分離架構，變成了存算一體架構？

宋春雨：存算一體已經是共識了。那些填補國内空白的下一代產品都已經是存算一體，來提升計算效率和降低功耗。

極客公園：華為是去年唯一一個做出AI芯片的廠商，和大廠相比，創業公司有多大機會能跑出來？

宋春雨：首先我們認為市場格局不會一家獨大。如果我們看全球份額，英偉達 GPU 這麼龐大了，谷歌的 TPU（張量處理器）還能在全球占 15% 的份額。現在 Altman（OpenAI 的 CEO）也要入場做芯片了，微軟也要做，所以 GPU 的份額會越來越少的，未來肯定是多種架構并存。

而相較于英偉達在全球 AI 芯片的壟斷地位，中國遠沒有形成這樣的格局。在國内，華為和其他 AI 算力芯片創業公司的起步時間點都差不多，現在就看誰能有產能，誰能夠構建生态，能在萬卡集群上訓練大模型。

我堅信有創業公司有機會，未來兩年會是一個比較重要的紅利期，中國算力芯片市場會分化出格局。

極客公園：我們距離實現真正的芯片國產替代還有多久？

宋春雨：如果是有和無的問題，那差距已經沒有那麼大了。

比如最近英偉達 GTC 大會發布了下一代 Blackwell 架構的 GPU，宣稱算力提高了 30 倍，這是非常重要的技術點。但我們通過增加卡數，它是 1 萬張最新的 GPU 卡，我們上 10 萬張，其實也能達到同樣的能力。這不是一個本質差别了。

英偉達在 GTC 大會上發布的 Blackwell 芯片（左），與較舊的 H100 Hopper 架構（右）對比｜圖片來源：英偉達

極客公園：Sora 這樣的多模态模型對算力考驗更大了，我們該怎麼應對？

宋春雨：多模态需要單集群萬卡，它考驗超算集群本身的連接能力、網絡通訊能力、内存管理能力等等。這個過程沒那麼容易，要非常大的投資。不過國家也在重點支持整個產業，這些都會幫助創業者。

不過，我認為未來算力的成本不會像現在這麼高。相當于摩爾定律，過了一段時間它就會降低到一定程度。

極客公園：大概能降低多少？

宋春雨：目前還沒有一個數字預測，有可能是現在成本的十分之一。未來算力或許像水、電、煤一樣，那是一個普惠智能的時代。

前所未有的變量湧現，大模型是一次「人類超級科技工程」

極客公園：你投了上一波AI四小龍中的曠視，它們當初的最大困境是模型通用性不高，導致 To B 交付基本是項目制，很難規模化、毛利不高。你覺得現在這一波的大模型公司能避免這個問題嗎？

宋春雨：這一輪大模型的泛化能力和通用性确實是好很多。從我們目前掌握的情況來看，它确實是可以跨客戶的。原來 AI 1.0 的小模型，每換一個客戶都需要針對客戶的數據和場景重新訓練，現在不用了。

極客公園：聯想一直在提AI PC 的戰略，你怎麼看大模型和端側的結合？

宋春雨：去年聯想宣布進入到 AI PC 的時代，包括 AI phone，AIOT，要用大模型賦能新的硬體。很多大模型公司都非常願意和我們合作。

我們相信未來端側會有專門的大模型，因為個人數據的隐私考慮，不能直接放到雲端（模型）上訓練。另外，端側模型能對用戶有更快速的響應。如果模型整合了端到端，在特定領網域的模型效率肯定是最好的。

極客公園：随着大模型跟機器人結合，這是否意味着機器人產業迎來了 GTP-3 的時刻？

宋春雨：我去年初就這樣認為了，只是當時不知道是誰會引領這個產業。

機器人的通用性，主要是大模型帶來的、而不是硬體帶來的。因為硬體就是一個驅動單元，驅動單元（的進步）是一個漸進式過程。但大模型能讓機器人理解物理世界，它會帶來劇變。

極客公園：您好像投了一些垂直領網域的機器人，你看好通用人形機器人嗎？

宋春雨：之前我投的是 AI 1.0 時代做特定任務的的機器人，現在我也讓團隊快速地去看通用機器人。在這個產業大潮裡，所有的領網域都在快速地迭代。我相信 10 年内，人形機器人可以產業化。

其他各個板塊，包括英偉達發布的新芯片，馬斯克開源的新模型，OpenAI 要發布 GPT-5，所有終端廠商全在談 AI PC、AI phone 和 AIOT，新進入的 top 玩家和 top 創業公司越來越多……這真是非常非常 Dynamic（動态變化）的大時代。

極客公園：這麼多的變量湧現，是不是你投了科技這麼多年從來沒有感受到的？

宋春雨：即使我們投科技這麼多年，也從來沒有感受到。

之前我們投寒武紀、曠視科技、第四範式、思謀科技，這都是 AI 1.0 時代非常非常重要的公司。那時侯的競争格局和產業收斂程度，可能是以三年為周期。但大家現在看到的大模型浪潮，基本是以半年為周期收斂。

這波大模型浪潮和之前所有的科技創新都不一樣。它是大 dynamic、大資金，大家從人才、資金等各個維度切進去，這是前所未有的一次人類超級科技工程。

「這個世界不愁錢，缺的是最好的創業者和最好的創業公司」

極客公園：聽說你們每年年初都會拿 3 個月時間，不做投資、只做行業調研。在大模型火熱的這兩年，你們都得出了什麼調研結論？

宋春雨：其實結論是相似的，核心就是相信 scaling law（規模定律）、相信視覺模型和語言模型要走向統一，最終人類最終會實現 AGI、進入矽基智能的大爆發時代。同時，我們也堅信中國應該出現自己的 OpenAI。

極客公園：為什麼要研究 3 個月、而且還要全員參與？

宋春雨：因為時代在發生很大的變化，當矽基智能時代到來，很多未知的東西都需要深入研究才能明白。

比如神經網絡為什麼要這樣的模式才能運行？為什麼在 Transformer 架構下加算力、再加超大規模參數就能湧現？模型的上限潛力到底在哪裡？如果我們想知道這些問題，就要研究，而研究之後，我們對 AGI 才有了信心。

極客公園：像你們這樣對 AGI 有技術信仰的機構并不多，最終是否有足夠的錢來支持創業公司昂貴的 AGI 夢想？

宋春雨：去年我去美國跟矽谷的大公司交流，他們跟我分享了一個數據。過去一年，矽谷的 VC 在人工智能大模型上投資的資金量，是 AI1.0 時代所有總和的 10 倍。這個資金量是非常非常驚人的。

中國也一樣，肯定有一年的資金量，會是過去 AI 1.0 時代的 10 倍。但這一年不一定是去年，因為去年才剛開始。大家都在摸索和學習的過程。

對生成式 AI 的投資在 2023 年迎來爆發｜圖片來源：CB Insights

極客公園：所以你對資金這個事還是比較樂觀？

宋春雨：比較樂觀。這個世界不愁錢，缺的是最好的創業者和最好的創業公司。

極客公園：現在大模型公司的投資方背後基本都是大廠，擁有資金、產業等優勢的 CVC，會是能陪創業者走到最後的機構嗎？

宋春雨：CVC 肯定是其中一股勢力。

極客公園：你覺得 AGI 的實現預計要多久？

宋春雨：估計是 2028 年到 2030 年。

極客公園：在技術的大浪潮下，會有一些對人類的憂慮嗎？

宋春雨：肯定會有。矽基智能和碳基智能的神經網絡原理，其實是非常非常相似的。人的神經網絡也是靠不斷學習、接觸數據、受到刺激，才能更加智能。

所以人不用腦也會落後，客觀一點說，人也要進步。

極客公園：聽說你們内部喜歡說「問對的問題」，可否提一個大模型行業的「對的問題」？

宋春雨：我們内部梳理出了 100 多個問題，比如開源和閉源的關系、大模型有多家還是一家獨大等等，都是我們想提出的問題。

極客公園：你們看好怎樣的創業者？

宋春雨：還是要在大模型創新上有非常強的認知、并且能不斷推進大模型的創新路徑。這種創業者是我最喜歡的。

極客公園：具體怎麼理解？

宋春雨：很多人是看到了 Sora 所以相信，但我不是，我是預判。創業者也是一樣。他不一定要先做出來什麼，但他要有能力去理解，這個是關鍵。