今天小編分享的互聯網經驗:讓用戶無痛開發AI應用,袁進輝新公司獲近億元天使+輪融資,歡迎閱讀。
作者 | 鄧詠儀
編輯 | 蘇建勳
36 氪獲悉,AI 初創公司「矽基流動」(SiliconFlow)近日完成近億元天使 + 輪融資。本輪融資由某知名產業方領投,跟投方包括智譜 AI、360 和水木清華校友基金等知名企業及機構,老股東耀途資本繼續超額跟進,華興資本擔任獨家财務顧問。
對本輪融資,創始人兼 CEO 袁進輝表示:" 非常感謝各位投資方對矽基流動的信任和支持。這次融資将幫助我們進一步加快產品創新,為開發者提供觸手可及的 AI 雲服務,促進 AI 應用層的繁榮,推動 AGI 技術普惠化。"
矽基流動是一家專注于 AI Infra(AI 基礎設施)領網域的創業公司,成立于 2023 年 8 月。創始人袁進輝是前 OneFlow(一流科技) 創始人及 CEO,曾任微軟亞洲研究院主管研究員,獲得微軟亞洲研究院院長特别獎。
通俗地理解,矽基流動所在的 AI Infra 層,是上接 AI 應用層、下接算力芯片層的中間層,相當于大模型時代的 " 作業系統 "。如何讓大模型訓練與推理更高效,充分釋放底層硬體的潛力,降低生成式 AI 應用開發的門檻與成本,正是 AI Infra 需要解決的關鍵問題。
大模型訓練包括對模型進行參數調優、數據訓練等環節,讓模型具備執行相應任務的能力;而推理則是在模型訓練好之後,讓模型進行預測與決策的過程,為 AI 應用提供智能能力。
其中,深度學習訓練框架是 AI Infra 的重要組成部分。這個領網域被大公司的開源產品所主導,典型框架有 Facebook 的 PyTorch,谷歌的 TensorFlow,國内有百度的 PaddlePaddle 等。從 2016 年開始,作為世界範圍内研發工業級通用深度學習框架的唯一創業團隊,袁進輝帶領的 OneFlow 團隊推出了高性能分布式深度學習框架。
之所以敢挑戰以大廠主導的 AI 訓練框架生态,是因為袁進輝确信:未來 AI 模型的參數量會越來越大。一旦模型變大,那麼原有的深度學習框架不能滿足開發者的需求,底層的 AI 框架就需要重構,而這是屬于創業公司的機會。
随後,以 GPT 為代表的大模型熱潮來臨,OneFlow 團隊所積累的大模型訓練技術和認知得到驗證。2023 年,處在大模型風口上的 OneFlow 團隊被原美團聯創王慧文所創立的大模型公司 " 光年之外 " 并購,随後," 光年之外 " 因故被美團并購,袁進輝帶領團隊創立新公司 " 矽基流動 "。
再次出發,矽基流動依舊将方向定在 AI Infra 賽道。只是,随着大模型走入大規模應用落地時期,推理效率成為阻礙生成式 AI 應用成功的一大技術挑戰。因此,矽基流動的技術方向瞄準了大模型推理領網域。
英偉達在 2023 年财報電話會後透露,在過去的四個季度中,英偉達數據中心約 40% 的收入都是推理需求驅動的。而根據 Gartner 的報告,2023 年專用于 AI 工作負載的芯片創造近 534 億美元的收入;到 2027 年,這一數字将達到 1194 億美元。這無疑是一個具有巨大商業前景的方向,當然,也是大公司和創業公司的必争之地。
袁進輝對 36 氪表示,他希望能夠帶領矽基流動,在技術領先的基礎上,重點解決上一次創業沒有解決好的挑戰——走通商業化閉環。
6 月,矽基流動正式推出了新產品 —— 一站式大模型 API 雲服務平台 SiliconCloud,匯聚了諸多主流大模型,如阿裡旗下的通義大模型 Qwen2、智譜旗下的 GLM-4、幻方量化旗下的 DeepSeek V2 系列開源模型,以及文生圖模型 SDXL、SDXL Lightning、PhotoMaker、InstantID 等。
基于矽基流動在 AI Infra 領網域的深厚積累,SiliconCloud 平台上的大模型響應速度更快,算力成本更低,大大提升了 AI 應用開發效率,并大幅降低了部署成本。比如,使用 SiliconCloud 調用文生圖模型 Stable Diffusion,可以達到 1 秒出圖;而調用大模型 DeepSeek V2,響應速度可達 50 Tokens/s。這是因為 SiliconCloud 集成了其圖片 / 視頻生成推理引擎 OneDiff,可以讓文生圖模型 SDXL 的最高可達 3 倍性能加速;同時,SiliconCloud 還集成了大語言模型推理引擎 SiliconLLM,在各類語言大模型推理場景中,其最高性能加速可達同類開源產品的 10 倍。
袁進輝對 36 氪表示,目前國内大廠旗下的大模型每天生成 Token 量在千億級别,而 SiliconCloud 上線公測後,平台的調用量就迅速增長。" 僅僅幾周後,每天的 Token 生成量達到了數十億。" 他說。
近期,矽基流動也利用技術優勢提供更低價格的模型服務。6 月 25 日,他們正式宣布 SiliconCloud 平台的 Qwen2 ( 7B ) 、GLM4 ( 9B ) 、Yi1.5 ( 9B ) 等頂尖開源大模型免費使用,開發者真正實現 "Token 自由 "。
當前,矽基流動的產品已在多個行業中廣泛應用,并且被業内頂級雲廠商、芯片公司和大模型公司相繼認證為最高等級合作夥伴。對于以後的市場發展計劃,袁進輝表示,公司将會同步拓展海外市場。