今天小編分享的互聯網經驗:對話開源中國馬越:DeepSeek不是國運級的創新,年輕人才是,歡迎閱讀。
文|鄧詠儀
編輯|蘇建勳
如果說關于 DeepSeek 的讨論已經過于泛濫,開源也許是當下依然值得讨論的主題。
長期以來,在國内談起 " 開源 ",都會無可避免地陷入一種尴尬的語境。
它當然是理想主義的。" 開源 " 背後的自由、開放特性,被普遍認為是互聯網精神的外化——源代碼向公眾開放共享,且允許在遵循特定許可證條款的前提下,對軟體進行自由使用、修改和二次分發。
最知名的開源項目 "Linux" 是作業系統的内核,催生了數以千萬計的開源軟體,這是互聯網世界的根基。
但它的背後經常跟着一個問題:為什麼要開源?怎麼考慮開源之後的商業化?哪怕到 DeepSeek 爆火的現在,也很難有人給出完美的答案。
開源中國董事長馬越,是最有立場談國内開源歷史的人之一,他在這條路上走了 18 年。
2008 年,馬越從矽谷回國創業,先是成立了 " 恒拓開源 " ——用開源軟體幫助企業擺脫數據庫、ERP 等大型軟體的束縛。
但很快他就發現,這種方案很難擺脫 To B 項目制的重投入,還很容易做成外包公司。
随後,馬越選擇收購 " 開源中國 " 這個社區,開始了一段曲折的創業路—— " 開源中國 " 經歷過數度轉型,從開源社區,拓展到代碼托管、代碼工具鏈,在探索商業化期間,經歷了從母公司剝離獨立發展,2019 年被百度戰略控股,最後,又在中美競争、國產替代浪潮中決定重新獨立發展,謀求上市。
做開源社區需要大量的資源、資金投入,在開源中國最艱難的時候,馬越背負的個人債務最高達 1.8 億元。
1972 年出生的馬越,有着一種老大哥式的坦率。他絕沒有賣苦的意思,但你很容易從他的叙述中,體會到經歷這些坎坷過後的幽默——他表示,在中國做 To B 就是 " 城市包圍農村 ",企業軟體就是管理者智慧的固化。當中國的企業發展階段還在初期," 你很難要求大家還沒吃飽喝足的情況下,去做開源。"
但這些時刻都已經過去了。開源中國也已經摸索出一條更适合自己的、中國式的開源道路。
現在,開源中國已經成為全球第二大的代碼托管平台,匯聚了超過 1800 萬開發者。其自主研發的 DevOps 工具鏈已在金融、軍工等關鍵領網域,達到 80% 的市場滲透率。2024 年,開源中國的營收已超過 2 億元。
《智能湧現》獲悉,「開源中國」近期正式完成數億元 C 輪融資,由北京信息產業發展投資基金(北京信產基金)領投,深報一本股權投資基金(深報一本)及北京上河動量私募股權基金(上河動量)跟投。
至此,開源中國已累計獲得超 16 億元戰略投資。
△開源中國董事長馬越 圖源:開源中國
馬越認為,哪怕在全球範圍内,開源也不是件容易的事情。他以 GitHub 舉例:從 2008 年成立開始直到被微軟收購,在 2022 年 ChatGPT 爆發後推出 Copilot,才算是正式證明了商業化潛力。
" 開源是強者和富人的遊戲。" 他說,上一代人都成長在物質更短缺的年代——商業社會也是如此,企業要先賺夠了錢,才有餘裕考慮是否開源,做一些人人為我、我為人人的好事。" 吃飽了飯,才能有力氣談開源。"
這就不難理解,即使 DeepSeek 的爆火為全中國都打了一記強心針,馬越的觀點依然是冷靜的。他認為,DeepSeek 很難根本性改變國内軟體生态的問題,這是一個時代的局限。
而想要在開源路線上有所成就,這要求新一代的開發者,從 Day 1 就開始出海,像 DeepSeek 一樣去全球市場中競争。
如果說 DeepSeek 改變了什麼,更多的都是文化和價值觀層面的事情。" 十年前大家普遍不理解開源,覺得開源是一群草根做的事,現在全社會都能認識到,開源等于創新。" 馬越說。
以下為《智能湧現》與開源中國董事長馬越的對話,經編輯:
DeepSeek 不是國運級產品,年輕人才是
《智能湧現》:開源中國現在是第二大代碼托管平台,國内最大的開源社區。DeepSeek 的熱潮,對你們的直觀影響,是從什麼時候開始的?
馬越:就是他在 App Store 登頂那會兒。先是 V3,然後是 R1 發布,一下子就火起來了。我們春節一直在加班,讓 DeepSeek 首先能在中國生產的 GPU 上運行,這需要大量工作,我們是第一個在沐曦芯片上部署的。
我們都在調侃,春節就兩件事:DeepSeek、哪吒。DeepSeek 就是開源圈出了個哪吒。
《智能湧現》:現在已經形成了一種論調:DeepSeek 是一個國運級的產品。但最近你的公開表達裡,似乎對這一點不太認同。
馬越:首先,大模型這個事情,你離不開英偉達吧?其次,你離不開 Transformer 架構;第三,你采用了蒸餾的思路,這些都不是國内原創的。
DeepSeek 本質上是在現有路線上走得最好,實現了彎道超車,這是值得尊敬的。
但是 DeepSeek 能夠不依靠外部資金支持,也不做任何 PR,靠技術就能做到全球頂尖——以梁文鋒為代表的年輕人崛起,這才是國運級的現象。
《智能湧現》:那什麼才算國運級的產品?
馬越:完全原創的技術創新。誰說 Transformer 就是算法的終局?如果有人用非 Transformer 方案做出比 DeepSeek 強十倍的成果,那才是真正的突破,那是人類級的進步。
《智能湧現》:DeepSeek 給開源生态最大的啟示會是什麼?
馬越:讓全社會認識到:開源等于創新。
DeepSeek 最令人唏噓的是,在國内兩年都默默無聞,也不如打廣告的很多大模型公司,直到 2024 年開始,才因為技術,因為開源,被美國人超級關注——雖然一部分人特别支持,一部分人極力貶低,這種關注反而倒逼着國内形成了一種愛國情懷。
《智能湧現》:以前大家不相信這個觀點嗎?
馬越:以前很多人認為開源就是一幫草根、烏合之眾,很難和大廠這種正規軍相比。
其實二十年前我就在說這些話:開源約等于創新能力,創新能力和國力是映射關系。正是因為我們有錢了、富足了,才會有 DeepSeek 這樣的企業出現。
以前沒人聽,現在有人聽了。
第二點很重要,就是要對年輕人保持敬畏。不只是尊重,而是要怕年輕人,信任年輕人。每一代人都有自己的時代使命,也有時代局限性。
《智能湧現》:這群年輕人,或者新一代開源貢獻者,為什麼能成長起來?
馬越:這種質變是建立在之前充分的量變基礎上的。
這十年要感謝走在前面的互聯網大廠,事實上國内的主要開源力量集中在這些有實力的企業上。包括百度、阿裡、騰訊等組織的開源項目,還有華為的鴻蒙、歐拉等等。他們都是領着工資的員工,在搞這些開源工作,不是純粹基于興趣。
《智能湧現》:DeepSeek 證明一件最關鍵的事:通過底層技術突破,就能吸引大量用戶,以及赢得尊重。
馬越:現在我們國家最應該做兩件事:一是牽頭一起開發中國的 CUDA;二是讓所有國產 GPU 都能快速支持這些模型。
說到生态,生态就是要有更多的人參與,而且大家都有高度共識。現在最大的問題不是芯片卡脖子,而是 CUDA 這個生态的制約。中國完全可以開發一套類似 CUDA 的系統,就像我們有自己的 GPU 一樣。
開源是富人和強者的遊戲
《智能湧現》:DeepSeek 爆火之後,找你讨論的人多嗎?大家最關心什麼話題?
馬越:有人問我,DeepSeek 會不會給中國 To B 市場帶來新生機?不可能那麼快。
IT 外包的人天價格,20 年來的漲幅還不如按摩師。現在外包人天均價一千就算高的了,還有五六百的。你去按摩,現在一小時都要一兩百塊錢。十年前,IT 的外包時薪就比不上按摩了,現在差距更大,那是因為按摩價格漲得快。
中國軟體沒人願意花錢,這是行業發展還不行的核心原因。要等這一代年輕人變成決策者,好時代才會來。
《智能湧現》:本質還是因為國内企業發展階段還比較早。
馬越:開源本質上是強者和富人的遊戲。正是因為我們吃飽喝足了,才會有 DeepSeek 這樣的企業出現。上一代互聯網用戶普遍不願意為軟體和知識付費,騰訊會議掉線了就重連,也不願意買會員。
但這一代年輕人生活富足,你們會改變這個局面。
《智能湧現》:DeepSeek 會給上一代 To B 創業者帶來什麼啟示嗎?
馬越:我覺得他們給創業者帶來兩個重要的啟示。第一是要對錢保持敬畏。創業的目的就是為了掙錢,談理想和情懷沒意義。
DeepSeek 不太需要考慮商業化的問題,是因為幻方已經解決了這個事情。
上一代的軟體創業者有個致命問題,一心想着燒錢,通過标準化產品打市場,這不是中國市場的運行邏輯,中國最有錢的金主都是大型企業,在中國想要賺錢,不做定制化是不現實的。
中國軟體行業是城市包圍農村,而美國是農村包圍城市,腰部企業數量很多。
《智能湧現》:DeepSeek 會改變大家對商業化的看法嗎?開源怎麼考慮商業化,是這個領網域的 " 天問 "。
馬越:如果要開源做創業項目,技術必須得硬邦邦。就是和 DeepSeek 一樣,Day 1 就出海,否則在中國太難賺錢了,時代還不夠成熟。
大家總是會舉例,比如紅帽那套模式也能商業化,但是想用這種方式在中國做一個上市公司,還不是這個時代的事。
《智能湧現》:你們自己也經歷了很長一段商業化探索的時期,是從什麼時候想明白要怎麼做的?
馬越:2020 年是個重要轉捩點。我們那年決定從百度獨立出來,重新謀求 IPO。那段時間因為美國開始在很多尖端技術上斷供,我們想抓住這個機會,真正成為一個獨立的開源平台。
想要做真正的本土開源平台,必須要是徹底中立的第三方,這是選擇重新獨立發展的核心原因。
《智能湧現》:想明白之後,都做了什麼?
馬越:我們現在從社區發展出了三大產品線。
開源中國社區(OSChina)現在已經完全進化成一個 AI 教育平台。我們是中國最大的開源社區,有 1000 多萬用戶。現在我們 24 人的團隊能創造約 5000 萬收入,還有淨利潤,這在社區團隊中很少見。
第二塊是代碼托管和研發效能平台 Gitee,現在平台有 3600 萬個代碼倉庫,服務 36 萬家企業。主要提供代碼托管私有化倉庫服務,确保很多中小團隊的代碼安全,客單每年 3000 塊左右。
從 2020 年到現在,我們已經能夠提供 DevOps 全生命周期國產替代方案,在滿足開發者需求的同時,也建立起一個自主創新、安全可信的本土開源軟體工具與生态。
第三塊是 AI 大模型平台 " 模力方舟 ",模型體驗、推理訓練到應用部署等等服務,都會提供。
《智能湧現》:為什麼會從社區拓展到後來的 DevOps,以及 AI 大模型基座?
馬越:一個開源公司想要成功,靠社區是不夠的,我們需要找一個閉環的商業模式,像 GitHub 那條路——社區、代碼托管是沒法達到這個目标的。GitHub 也是在大模型浪潮來了之後,推出 Copilot,才把營收做起來。
以後沒有淨利潤的公司很難在國内上市,所以我一直強調看毛利率和人效,這兩個指标高了,自然會有淨利潤。
《智能湧現》:你們現在的主要收入,來自哪裡?
馬越:我們主要收入來自 100 家左右的銀行、券商、軍工、制造業客戶,都走大型私有部署形式。中小客戶主要靠 SaaS 服務。
2024 年我們全國訂單超過 2 億,是一個突破。前年過 1 億,2024 年翻了一倍,還實現了盈虧平衡,這很不容易。
《智能湧現》:主要模式靠服務大型企業的話,怎麼避免走到項目制的老路?
馬越:我們的產品做得很復雜,是因為中國的大型企業的場景復雜。我們的流程引擎、角色引擎、互動界面、流水線都是可定制的,還能做各種插件,就是為了保證靈活性。
我們會幫客戶做定制化配置,但是不做二次開發。我們現在 330 多人,這塊業務占 200 多人,但定制化去做開發和交付的不到 10%。
第二是我們自己堅決不賣算力,只做第三方,比如給雲廠商導流。
我們現在的路線很清晰:前端社區承載大流量,做開發者工具賣給企業,先 To C,再 To B,也算是一種產品驅動增長(Product-Driven Growth)的模式。
一起發展,比單打獨鬥強
《智能湧現》:是否選擇開源,企業的考量到底是什麼?
馬越:現在大模型不開源很難。蘋果為什麼到今天 iOS 都不開源?因為硬體生态已經形成壟斷。如果沒有類似這樣的護城河,你不開源,憑什麼在市場立足?
就像我十幾年來一直說的,開源是創新的最佳方法論,也是市場競争的方法論,是反強權的方法論。你做得好,我們就開源來和你競争。當年有 Unix 和 Windows,就有 Linux;有 iOS,後來就有 Android,都一樣。
《智能湧現》:你做過很多并購,DeepSeek 的成功會改變投資人對開源項目的看法嗎?開源項目的出路會變得寬嗎?
馬越:這也是我想問所有投資人和創業者的問題:投資的目的是啥?到底你希望怎麼賺錢?
上市、被收購、分紅都是一種退出方式。但現在在國内,要麼 IPO,要麼死掉,這很殘酷。
中國的開源生态很分散,現在很多創業者缺乏一種共識,就是一起發展比單打獨鬥強。很多人把創業當作獲取情緒價值的方式,就想當老大,寧可公司死也不願意賣給别人。覺得賣了就是投降,這坎兒過不去。
如果放不下自己的 ego,最終就會害了自己,也害了客戶和投資人。
《智能湧現》:DeepSeek 大獲成功之後,你怎麼評估現在我們所處的 AI 發展階段?
馬越:如果類比互聯網那個時代,我們還是在大時代的開端狀态,類似當年的撥号上網階段。我從 1997 年開始上網,下載一張照片要四五天,網速只有 28K。但即便如此,我們也覺得很神奇。
現在就像出海探索新大陸,所以創業者只要帶着幹糧上了船,不淹死,就一定有收獲。
《智能湧現》:DeepSeek 會怎麼改變現在國内的創業格局?你覺得更利好大廠還是創業公司?
馬越:很難說,可能還是大廠比較有優勢。
首先,DeepSeek 不是一個創業公司,人家不用外部資金就能買一萬張卡,某種程度上也算個小大廠了。
我覺得 DeepSeek 給創業者帶來兩個重要的啟示。第一是要對錢保持敬畏。創業的目的就是為了掙錢,談理想和情懷沒意義。
初創公司除非在算法、技術底層有突破,否則在工程層面,很難跟大廠拼數據,拼流量,這是最終商業化的兩個要素。
《智能湧現》:現在的大模型初創的轉向都很明顯,方向聚焦,專心打底層技術。
馬越:這就是開源的可怕之處。
我前年就說,預訓練是大廠的遊戲,創業公司應該做垂直領網域的訓練,把更多精力放在推理上,燒錢的事情本來就不該做。
歷史上都有很多例子,當年開源領網域有很多做容器的公司,比如 Docker 剛出來時只是各種容器運行時技術中的一種。結果 K8s 生态起來之後,任何容器技術只要實現 K8s 兼容性,就可以融入雲原生技術棧,這種強大的生态整合能力最終使其它技術方案逐漸邊緣化,相當于前邊都白做了。
所以我給大家的建議,包括我們自己的策略,就是產品功能要緊跟随,但要輕投入,商業模式要做輕一點。
《智能湧現》:對開源中國來說,未來的目标會是什麼?
馬越:開源中國這十幾年,積累了用戶流量護城河,客戶品牌美譽度,現在是通過信創找到了快速增長的收入模式。
我們在這輪融資之後,也會開始尋求進一步上市,希望成為 A 股人工智能開源第一股。
歡迎關注
歡迎交流