今天小編分享的互聯網經驗:DeepSeek引爆國產适配的前夜,「硅基流動」已完成億元融資,歡迎閲讀。
文|鄧詠儀
編輯|蘇建勳
有人預料到 DeepSeek 能引爆全球嗎?至少,DeepSeek-V3 發布前,在大模型戰場前線 " 賣鏟子 " 的袁進輝心裏也是打鼓的。
1 月 28 日,他在社交媒體上回憶起一個故事:DeepSeek 爆火前一個月,梁文鋒曾建議硅基流動部署 DeepSeek-V3,至少準備 20 台 H800,80 台最好。袁進輝迅速算了算賬,一個月 80 台 H800 伺服器就要支出五六百萬的算力成本,這些機器還不一定能用滿。" 風險太大了,就沒下注。"
随後 DeepSeek 火爆全球,洶湧的流量讓其官網和 App 很快崩潰,熱情的用户急于找到能正常使用 DeepSeek 的渠道。袁進輝感慨:" 現在 DeepSeek 這麼火,決策失誤,欲哭無淚。"
很快,這種懊悔轉變成強大的行動力。苦于算力不足的硅基流動找到華為,全力完成 DeepSeek-R1 & V3 在昇騰芯片上的适配工作。整個春節期間,硅基流動團隊沒有休息過一天。
他們的動作夠快,承接住了第一波流量。2 月 1 日,硅基流動首發了基于華為昇騰算力的滿血版 DeepSeek-R1 & V3,迅速吸引了大批開發者和個人用户。
△圖源:SimilarWeb
這是一次巧妙的合作,一舉掃清市場對于國產芯片性能瓶頸的疑慮,證明了在國產芯片上部署 DeepSeek,也可以獲得持平全球高端 GPU 部署模型的效果。同時,這次合作無意間觸發了一場國產替代的狂歡。
硅基流動也借此證明了自己的 AI Infra 實力。" 尤其這次上線 DeepSeek R1 & V3 之後,湧過來的合作線索,暫時都看不過來。" 袁進輝説。
就在硅基流動爆火之前, 《智能湧現》獲悉,硅基流動(SiliconFlow) 在 2024 年底 就已完成億元人民币 Pre-A 輪融資,由華創資本領投,普華資本跟投,老股東耀途資本繼續超額跟投,華興資本擔任獨家财務顧問 。
值得注意的是,本輪融資之前,硅基流動已引入美團作為戰略股東。
2024 年 8 月,《智能湧現》曾采訪過創始人袁進輝,當時硅基流動正好成立一周年,剛發布 MaaS 平台 SiliconCloud。
你可以将 SiliconCloud 想象為一個 " 大模型 API 超市 ",開發者只需要注冊賬号,選擇自己想要的模型,就可以開發應用,免去購買伺服器的負擔。甚至,經過硅基流動适配和優化後的模型,還能做到比原廠模型響應更快、推理成本更低。
在這一年間,硅基流動經歷了起碼十倍的市場增長。SiliconCloud 已經獲得了超三百萬的用户,日均調用上千億 Token ——去年剛上線時,這個數字還是日均百億。
△圖源:硅基流動
在開發者圈子中,硅基流動有着良好的口碑,因提供親民價格和優異性能的模型服務被稱為 " 賽博菩薩 "。現在,SiliconCloud 已經上線了包括滿血版 DeepSeek-R1 & V3、Qwen、FLUX.1、CosyVoice 等在内的上百款主流模型,也提供模型訓練、微調、托管到部署的全套工具,滿足開發者及企業客户的不同應用場景需求。
2024 年 7 月,硅基流動也推出了一款新產品:基于 ComfyUI 的雲節點插件 BizyAir。
BizyAir 是一款影像生成工具,能夠讓 AI 開發者與創作者無需考慮顯卡和環境限制,即可直接使用雲計算資源完成生圖任務。截至目前,BizyAir 支持數十種模型,支持 ComfyUI 本地節點混跑,已經獲得了近萬名用户。
硅基流動在這一年間也開始了 To B 商業化擴展,與華為、亞馬遜雲科技、英偉達等頂級雲廠商、芯片廠商、大模型公司及應用公司建立了合作夥伴關系。
企業服務方面,硅基流動已經在大語言模型、文生圖、視頻生成等多個場景,有标杆客户案例的落地。硅基流動目前提供四種服務模式,包括專屬實例、算力納管、私有版 MaaS、基于華為昇騰 910 系列 NPU 的一體機。
毫無疑問,DeepSeek 已經一掃 2024 年大模型領網域的陰霾,一場宏大征程的序幕已經展開。2024 年,袁進輝曾對《智能湧現》表示,在 GPT-4o 出來後,大模型的語言能力、知識能力方面的限制都解決得比較好了,除了邏輯推理能力。
OpenAI o1、DeepSeek R1 的出現,意味着大模型在 " 邏輯能力 " 這個問題上前進了一大步,這對應用市場是巨大利好。
" 可以預期,國内外基于 DeepSeek 的應用将爆發,這一天終于要到來了。" 袁進輝説。
以下為《智能湧現》與創始人袁進輝的問答:
《智能湧現》 :上一輪融資之後,硅基流動在產品方面有什麼節點性的進展?關鍵性能提升的程度如何?
袁進輝 :主要是适配了華為昇騰芯片、開源了 ComfyUI 雲節點 BizyAir,以及持續上線最新模型,并且上線了模型微調、托管等功能。
底層推理框架的性能依然保持業内領先,性能優化是一項需要長期、持續性投入的工作。
《智能湧現》 :推出相關產品後,市場都有怎樣的反饋?商業落地上有什麼關鍵性進展?
袁進輝 :SiliconCloud 獲得了爆發式增長,目前平台有超三百萬用户,日均調用超千億 Token;BizyAir 在沒做什麼推廣的情況下獲得了近萬名用户。
商業落地方面,尤其這次上線 DeepSeek R1 & V3 之後,湧過來的合作線索暫時都看不過來。
《智能湧現》 :去年 7 月硅基流動上線了 BizyAir,為什麼會推出這個產品?戰略定位是什麼?
袁進輝 :BizyAir 是一個意外驚喜。起初,這是一個試驗性項目,其實還是幫助用户用高性價比的推理服務資源,更方便地進行生圖。在 BizyAir 之前,我們開源的圖片 / 視頻生成推理加速組件 OneDiff,由于性能好、靈活、支持模型豐富,已經有較好的口碑。在做 OneDiff 的過程中,我們了解到生圖用户的常見痛點,包括出圖慢、工作流組合繁瑣、上手門檻高等,所以我們嘗試開發了 BizyAir,發布後受到了不少用户的喜愛以及自發傳播。
《智能湧現》 :去年你説,大模型的語言能力、知識能力方面的限制都解決得比較好了,除了邏輯。Deepseek V3 之後,是不是邏輯能力也做得足夠好了,2025 年會迎來現象級的應用嗎?
袁進輝 :那時還沒有 OpenAI o1、DeepSeek-R1。它們的發布已經展示出模型的強大邏輯推理能力,并且 DeepSeek-R1 把思考過程完整地展示了出來,看上去更像是一個有思辨能力的人在思考。
現在,開發者基于标準 API 可以做很多很酷的應用了,可以預期,國内外基于 DeepSeek 這樣的開源模型的應用将爆發,這一天終于要到來了。
《智能湧現》 :最近硅基流動迅速基于昇騰上線了 DeepSeek,春節期間也有大量開發者湧入,你們在前線看到的情況是怎麼樣的?
袁進輝 :我原本以為我們能接住這波用户,但市場對 DeepSeek-R1 & V3 的需求量太大了,目前不得不對免費用户進行限流,當然,我們也在積極擴展資源,希望能讓用户敞開用。
我們作為一個面向開發者與企業客户的 API 平台,但是光官網的 Playground 就有幾十萬日活,可見 DeepSeek 需求量之大。
《智能湧現》 :很多第三方企業宣布接入 DeepSeek-R1 & V3 ,但為什麼實際能提供滿血版的企業很少?
袁進輝 :一方面,部署滿血版 DeepSeek R1 & V3 需要的算力資源非常大,用 80 台 H800 來部署,每月需要五六百萬的算力成本,一般企業與其自己本地部署,顯然接入硅基流動 SiliconCloud 這樣的雲服務 API 更劃算;
另一方面,要部署 DeepSeek R1 & V3 這樣的 MoE 模型技術挑戰很大,需要專業的 AI Infra 團隊才能部署成功且把性能優化得很好,硅基流動 SiliconCloud 曾是國内最早部署上線 DeepSeek 模型的第三方平台,也是首個在國產芯片上适配部署 DeepSeek-R1 & V3 的 AI Infra 公司。
封面來源|AI 制圖
掃碼加入「智湧 AI 交流群」
歡迎加群
歡迎交流
本文來自微信公眾号" 智能湧現 ",作者:鄧詠儀,36 氪經授權發布。