今天小編分享的科學經驗:PPTV創始人姚欣AI再創業,“分布式推理”終于有人做了,歡迎閱讀。
這個月,PPTV 創始人姚欣再次站到了聚光燈下,組織了一場分布式雲計算論壇,向外界揭開了他的新篇章。
姚欣的第二次創業,瞄準了雲服務,要打造 AI 時代的基礎設施。
但姿勢獨特:公司沒有自建 IDC 和購買 GPU,而是通過獨特的方式成為了全國最多節點的雲服務商。
成立六年來,PPIO 派歐雲已獲三輪共 4 億元的融資,包括百川智能創始人王小川、迅雷創始人程浩、前微軟 Azure 中國總裁申元慶在内的 19 位 CEO 都參與了天使投資。
姚欣,曾是互聯網視頻時代的開拓者,2004 年,他在華中科技大學讀研時辍學創業,發明了 P2P-Streaming 協定,創辦了覆蓋全球 4.5 億用戶的視頻平台 PPTV,比 YouTube 還早 1 年。
PPTV 在 PC 時代創立,移動互聯網早期就迅速崛起,2012 年位列中國視頻網站用戶規模第 2 名。然而,2014 年,姚欣将 PPTV 出售,似乎淡出了公眾視野。
姚欣重回到公共視野的當下,我們不禁想問,在市場接近飽和的環境下,為何姚欣堅持要選擇雲服務賽道?又因何受到投資者如此青睐?
一方面,時勢造英雄,2020 年 Gartner 開始推崇的分布式雲概念,給了姚欣這個 " 分布式信徒 " 難得的發展機遇;
另一方面,英雄造時勢,姚欣也前瞻性地選擇跳過訓練算力業務,全部聚焦發展分布式推理算力,下注 AI 應用普及對于推理算力的巨大需求。
當分布式計算遇見 AI Infra
要理解姚欣的再創業,可以先從這樣的具體案例中感知——
國内某 Top3 小說推廣 APP,開始為創作者提供 AIGC 生圖功能,吸引了更多的作者和讀者。
AI 技術帶來的流量增長自然是一件好事,但與此同時帶來的運維壓力也陡然上升。
而且随着這樣的新功能被更多人所熟知,後台伺服器性能也遇到了瓶頸,高峰時期生成速度明顯變慢的情況開始逐步顯現。
在過去,解決的方式簡單粗暴——擴容,但一味地選擇這種方式,實際并非長久之計,不僅代價高昂,而且在面對不确定性增長時顯得力不從心。
而 PPIO 的分布式架構,就是針對這種場景和痛點而生。
這不僅是一種技術選擇,更是一種為未來打下基礎的架構方案。
它打破了傳統集中式架構的瓶頸,不僅為企業大幅降低了運維壓力,還将系統的處理效率提升到了一個全新的高度。
△PPIO CTO 王聞宇介紹派歐算力雲產品
利用 PPIO 提供的 AI 推理平台,免去了自行部署後台服務的繁冗過程,通過 API 即可調用服務,不再需要自行運維,成本直接減少了 40%。
速度方面,得益于 PPIO 龐大的分布式算力網絡,網絡擁堵現象大幅降低。
據了解,采用 PPIO 服務後,該小說 APP 的平均生圖時間從 10 秒縮短到了 2 秒,生產效率提升了 50%。
姚欣還介紹,如果海外 AI 應用使用其推理服務,能夠獲得比矽谷還要高的綜合性價比。
這得益于 PPIO 遍布全球的分布式雲服務網絡,無論用戶身處何地,總能找到近距離的算力節點,獲得 20 毫秒級的低延遲體驗。
姚欣選擇分布式推理并非偶然,而是基于他多年對整個行業的深入理解。
根據 TIRIAS research 的研究,随着 AI 的快速發展,未來算力需求的構成将發生重大變化,95% 的算力需求來自推理,訓練算力僅占 5%。推理将逐漸成為 AI 計算的核心。
姚欣看準了 AI 時代算力結構轉型的機遇,将重心放在推理側。
推理計算的核心在于實時處理用戶請求,低延遲和高效率是它的生命線。
而分布式技術,恰恰是實現這一需求的不二之選——
通過将推理計算分布到全球多個節點,PPIO 能夠最大限度地減少到用戶的時延;
同時根據不同區網域的需求波動智能調度算力資源,确保全局計算效率始終保持最佳狀态。
分布式推理不僅是一次技術創新,更是一種新的商業模式,讓中小企業和開發者不再為算力門檻所困,讓他們也能走進 AI 世界。
相比之下,傳統的大型數據中心雖然具備強大的處理能力,但其成本高昂,不僅包括硬體設備的購置和系統維護,還包括高度集中帶來的大量散熱能耗的需求。
分布式雲通過調度分布在全國各地的中小型數據中心或邊緣計算節點,充分利用當地高性價比能源和算力資源,降低總體運營成本。
當然,姚欣還提出了 " 三年内降本 1000 倍 " 的期望,要想成功實現,除了龐大的分布式算力網絡,還要有更多創新技術的支撐。
為此,姚欣給出了他的答案——Serverless 彈性調度和推理加速優化。
其中,Serverless 架構被用來解決跨區網域服務過程中節點數量龐大、用戶請求復雜的問題。
該架構通過智能整合分布式算力,自動實現彈性伸縮與按需付費。
用戶可将自有鏡像或模型托管到該平台,不用再擔心海量用戶的并發響應問題,亦無需親自管理和維護大量算力伺服器。
△派歐算力雲 Serverless 產品自動彈性觸發時延和單實例冷啟動速度
除此之外,PPIO 還通過算法、系統和硬體的協同創新,推出了針對大語言模型特點的推理加速引擎。
借助全鏈路 FP8 量化、KV Cache 稀疏壓縮算法,以及投機采樣等技術,顯著提升了推理的加速性能,打破了顯存、算力和帶寬的限制,釋放了大模型推理的更大潛能。
此次的分布式雲計算論壇,标志着姚欣的第二次創業取得了階段性的成功。
這背後除了有姚欣自己對行業的獨到見解,還有分布式雲自身與雲服務發展形勢的契合。
分布式雲的天時地利
在國内的雲服務領網域,有很多我們耳熟能詳的選手,華為、百度、騰訊、阿裡等眾多互聯網大廠,都擁有自己的雲服務產品。
但這些雲服務無一例外都采用了集中式的方式,更加襯托出了姚欣做的分布式雲系統的别具一格。
不過,姚欣強調,分布式與集中式并非對立的選擇,而是相互補充的合作模式。
技術上看,PPIO 采用了集中式雲服務也在用的基于 K8S 技術的雲原生架構,能夠與集中式雲進行标準的互聯互通;
商業模式上看,用戶也不會過度關注自己的產品究竟運行在哪種雲,他們更在意的,是最終的運行效果。
歸根結底,究竟應該采用哪種運算方式,取決于具體的應用場景。
在競争與合作共存的格局當中,分布式雲的獨特優勢在于,它能夠解決集中式雲難以應付的需求。
随着 AI 新應用的大量落地,產生了大量的實時數據計算和海量 IO 吞吐,AI 帶來的新算力需求以超越摩爾定律的方式不斷膨脹。
正是這些大量實時計算需求的湧現,讓傳統的集中式算力中心顯得捉襟見肘,但這真的是因為算力總量不夠用嗎?
答案是否定的。
據統計,我國有 47%,也就是将近一半的算力都處于閒置狀态,未被充分利用。
造成這一現象的核心原因,是算力需求與供給的不匹配。數據中心和超算中心的建設過于超前,但數據產生地與算力節點往往相距甚遠,造成了算力不足的表象。
所以,算力唯有" 去中心化 ",下沉分布到網絡側邊緣,才能解決時延和海量數據 IO 吞吐問題。
PPIO 做的就是這樣的工作,其本身不生產算力,而是作為空閒算力的 " 搬運工 " 和 " 指揮員 ",解決算力時空分布不均、利用效率低下的窘境。
當然,姚欣的願景不僅限于當前的雲服務,他提出了算力發展的三條曲線,目前已經基本建成的,是其中的前兩條——邊緣雲(紅色)和算力雲(綠色)。
去年,PPIO 更是根據這兩條 " 曲線 ",将公司的業務線拆抽成了兩個事業部。
而 " 第三條曲線 ",則是實現各個組織機構間,算力資源的實時調度和自由交易。
姚欣認為,從技術角度看,業界已經有能力實現這種模式,但在產業共識和商業模式上,還需要參與者的共同努力。
但就像從雲計算誕生之初,人們都不相信公有雲,到後來公共雲服務逐漸成為主流一樣,這種 " 算力共享 " 也将經歷一個形成共識的過程。
而之所以選擇這條與眾不同的創業之路,源自姚欣豐富的創業經歷與技術信仰。
創業者姚欣:立志把分布式技術寫進教科書
公眾眼中的姚欣有很多标籤:大學創業、網絡電視、互聯網、投資人等。
然而,常常被忽略的是,他在技術方面同樣擁有着深厚的積澱。
事實上,姚欣自從高中時起就是一名學霸。
他曾連續兩年獲得全國奧林匹克計算機競賽一等獎,1999 年被保送進入華中理工大學(現在的華中科大)。
也正是在大學生涯之中,姚欣接觸到了分布式計算這個概念——他的老師金海教授(華中科技大學教授,中國計算機學會副理事長),正是将這一概念帶入中國的第一人。
金海教授早在 2002 年就開始負責中國教育網的網格計算(分布式計算的一種)建設,2007 年也是第一批從事虛拟化和雲計算研究的科研專家。
一直到現在參與設計國家提出的 " 東數西算 " 和算力網絡,是中國分布式計算領網域的領軍人物。
當時,金海教授就跟姚欣講了算力大眾化的願景:
當有一天網格(當時的叫法)足夠分布的時候,我們每個人用算力就像用電用自來水一樣,随時随地接上插頭、打開水龍頭就可以使用到。
金老師所描繪的技術普惠理念深深影響了姚欣,并植入了他的創業初心。
除了金海教授讓姚欣接觸到了分布式計算,姚欣的創業的另一大源動力是他對身邊事物的觀察。
姚欣讀大學時正值 2002 年世界杯,在校園中觀看足球比賽就成了一個火熱的需求。
其間,姚欣發現了一個不尋常的現象——
像 HTTP、FTP 這樣的傳輸協定,用的人越多速度也就越慢,但如果用 BitTorrent 這種 P2P 的傳輸方式,用的人越多,速度反而越快。
網格計算需要連接很大的計算節點,但可以整合每個人電腦的上行帶寬,構建一個分布式的存儲和傳輸的網絡,提供基于 P2P 技術的網絡電視服務。
PPTV 的成功,毫無疑問依賴于技術優勢。相比(當時的)優酷、土豆等競争對手,PPTV 的視頻處理成本僅為其 1%。
後來,賣掉了取得成功的 PPTV 後,姚欣開始重新思考自己的未來目标。
他不再滿足于 " 一人的成功 ",而是想将其轉變為 " 眾人的成功 ",希望通過聚集更多人的力量來實現改變生活的技術創新。
從視頻行業中暫時淡出的姚欣,也始終未曾遠離分布式計算的技術願景——
在 PPTV 的成功背後,正是他對資源整合和計算效率提升的深刻理解,而這些理念也是他對分布式計算長久關注的理論基礎。
這也直接推動了他後續的技術創業選擇,并在分布式推理領網域的發展中得到了實踐。
在姚欣看來,創業者最重要的,不是随大流,不是去模仿,而是要有足夠的差異化和獨特競争力。
所以即使在今天看來,PPIO 選擇的分布式賽道,依然如同 PPTV 一樣,顯得十分 " 另類 " 而新穎;
自己不建大型數據中心,而是整合利用大量的閒置數據中心,這種商業模式也是獨樹一幟。
從 P2P-Streaming 到分布式推理,姚欣的創業路徑看似從互聯網内容平台轉向了技術基礎設施,但實際上,這兩者本質上是一脈相承的。
姚欣始終在探索如何通過網絡的集體力量提升效率、降低成本,并以分布式技術為基礎,解決計算中的瓶頸問題。
如今,他将同樣的理念應用于 AI 推理領網域,專注于解決算力供需不平衡的問題。
走到今天,姚欣的志向已經不只是把企業做大做強,而是希望能夠開創出具有時代意義、能夠被寫進計算機教科書的技術。
正是出于這一理想,PPIO 聘請了金海教授擔任公司技術委員會主席。
金海教授将為公司技術團隊提供深入全面的指導,将分布式雲技術邊界進一步拓展,推動更多應用的落地,讓更多創業者輕裝上陣。
One More Thing
在剛剛結束的 2024 分布式雲計算論壇上,PPIO 除了推出了 AI 算力雲產品外,還聯合 PingCAP、Zilliz、AscentStream 和 CSDN,共同啟動了"Pioneers AI 初創加速計劃 "。
面向 AI 初創企業和開發者,提供包括分布式算力、分布式關系型數據庫、分布式向量數據庫、分布式消息隊列、開發者社區等全面的資源和技術服務,助力初創團隊在分布式雲上實現快速成長,加速其創新成果的落地。
正如姚欣在分布式雲計算論壇上說的那樣,他的終極目标不僅是推動分布式雲成為廣泛應用的技術标準,更是通過持續創新,幫助更多企業和開發者在 AI 時代中獲得成功。
我們站在 AI 時代的門檻前,正在見證一批又一批滿懷夢想的開拓者紛紛湧現。
正如當年那個 24 歲的姚欣一樣,他們需要的,不僅僅是資金和技術,更需要來自同路人、來自先行者的經驗和鼓勵,就像當年的金海教授一樣。
現在,輪到了我們承擔起這樣的使命,用分布式的力量,做新一代應用的基礎設施,支撐起新時代的開拓者砥砺前行!
"Pioneers AI 初創加速計劃 " 入口:
https://www.ppio.cn/campaign/ai-pioneers
— 完 —
點這裡關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>