今天小編分享的科學經驗:Nature認證DeepSeek成科研工具全能者,國内高校如何借力大模型?,歡迎閱讀。
DeepSeek 的風,也是飄到了科研領網域——
最新消息,同濟大學通過百度智能雲千帆大模型平台接入并調用 DeepSeek-R1/V3 系列模型;
包括浙大、北大清華等知名高校也是紛紛出動,要麼接入模型推出智能體,又或者出品幹貨課程、使用手冊《從入門到精通》等等,幾度都登上熱搜。
Nature 更是幾度發文,因為 DeepSeek 開源低成本易部署等優勢,科學家們紛紛湧向 DeepSeek,這種模型已經是科研 AI 工具中的全能者。
感知到的是,大模型在科研探索中發揮的價值遠比以往任何時候都深入。
但高的使用量,随之而來的就是算力需求井噴。除了帶來模型本身的穩定性、易用性等挑戰,傳統的科研機構還面臨算力資源碎片化、人才培育滞後等問題。
春節期間,我們看到,整個 AI 產業鏈都被積極調動起來,來支持模型穩定運行。
但因為科研環境中,對數據的準确性、隐私安全方面的要求以及模型可靠性、穩定性、易用性要求更高,像 DeepSeek 這樣的大模型能真正應用到科研探索,其實難度不小。
像模型的易用性問題,科研人員并非都具備深厚的 AI 技術背景,也沒有那麼多時間成本來學習大模型如何配置。他們可能需要花費大量時間學習如何操作模型,而無法将精力集中在核心的科研問題上,嚴重影響科研效率。
而且這還只是模型本身的挑戰,還存在一些系統性難題,其中以算力與人才最為突出。
算力「飢餓與浪費并存」。科研機構無法像企業那樣投入大量資源來建設 AI 基礎設施。同時算力資源分散,不同機構不同設備難以實現有效整合和協同使用,從而影響整個科研項目的進程。所以我們經常就會看到有科學家在線求算力,即便李飛飛也曾透露過斯坦福團隊算力不夠的情況。
人才培養的滞後性。技術發展過快,產業界的 AI 人才稀缺甚至是靠高薪來搶人,而在科研這端,這種既懂科研專業知識又掌握大模型技術的復合型人才可能更是少之又少。
基礎設施是技術研究的基石,缺乏足夠的科研基礎設施,也就很難吸引到人才,同時也限制了技術的發展空間;而沒有足夠的人才來操作設備,基礎設施也無法發揮出它應用的作用,還會影響到上層模型本身的發展。
如此循環往復,那麼大模型在科研環境中的應用進程也就更顯道阻且長了。
今時今日如何破局,也就顯得更為緊迫和艱巨。
AI 科研新基建:算力為核心,全生命周期支持
這段時間,在一眾鋪天蓋地的新聞中,有這麼一則 AI 算力產業界的進展備受關注——
昆侖芯 P800 萬卡集群成功點亮,這是國内首個正式點亮的自研萬卡集群,并且還計劃将這一數字擴大到三萬。
大家一邊感嘆于它性能方面的顯著,其規格其顯存規格比同類主流 GPU 高出 20%-50%。它對 MoE 架構更友好,并且支持 8bit 推理,單機 8 卡就能運行 671B 滿血版模型。
正因如此,昆侖芯相較同類產品更加易于部署,同時可顯著降低運行成本,輕松完成 DeepSeek-V3/R1 全版本推理任務。同時,昆侖芯 P800 在 DeepSeek 系列 MoE 模型大規模訓練任務中也表現出色,全面支持 MLA、多專家并行等特性,僅需 32 台即可支持模型全參訓練,高效助力模型的持續訓練和微調。
而在另一邊,科研團隊還關注的是,它在能效比上面的優勢——
對比通用 GPU,它部門算力功耗可以降低 40%,幫助科研團隊突破傳統 GPU 集群的電力瓶頸。
經過清華智能產業研究院驗證,他們搭載昆侖芯 P800 的算力集群成功将千億參數模型的訓練周期從 28 天縮短至 19 天,電力成本節省超 300 萬元。
而且因為該芯片擁有完全自主知識產權體系,從指令集架構到編譯器工具鏈全棧可控,能夠保證科研應用過程中的數據安全。
像北京前沿計算研究中心基于昆侖芯構建的聯邦學習平台已在醫療影像分析領網域實現多機構數據協同訓練,模型精度提升 12% 的同時,完全滿足隐私合規要求。
能夠看到,自研芯片構建算力集群也許是破局關鍵,它能解決訓練成本、數據安全等方面的難題。
不過能夠吸引這麼多高校 Pick 合作,不僅僅是因為百度智能雲部署了昆侖芯,而是一整套 AI For Science 解決方案。
它憑借多年全棧技術布局,以及與多家頂尖高校生态合作,沉澱出這麼一套方案——
包括昆侖芯 P800 芯片、百舸異構算力平台、飛槳深度學習框架以及千帆大模型平台等。
在此之前,還不曾系統性梳理過,今天不妨就來一一拆解,看看背後有哪些值得學習與借鑑。
首先,昆侖芯 P800 集成的萬卡集群,它是 AI 基礎設施當中的定海神針。只有自主可控的堅實底座,才能推動大模型技術持續迭代與生态繁榮。
其次,百舸異構算力平台,可以理解為算力中樞,或者是統籌師,面對科研環境中復雜多樣的算力需求,這個中樞就顯得格外重要,通過預測調度等操作實現算力資源的高效統籌,它在提升算力利用效率、降低成本、加速科研進程等方面成效顯著——
上海交通大學 AI 研究院部署百舸平台後,GPU 利用率從 35% 提升至 72%,任務排隊時間減少 60%,模型訓練效率得以顯著提高。
如此解決科研中算力資源碎片化的痛點,源于他在架構算法以及服務模式化上面的創新。
架構方面,它建立了一個靈活彈性的算力供給網絡。物理層兼容昆侖芯、英偉達、AMD 等多元算力芯片,資源層提供容器化算力單元,服務層則支持 Kubernetes、Slurm 等多種調度系統。
算法層面,它的智能調度算法有三個方面的創新,比如基于強化學習的動态資源預測模型可提前 24 小時預判算力需求波動;跨集群任務遷移技術實現全局負載均衡;異構資源感知調度器可将不同類型計算任務精準分配到最優硬體組合。
還有服務模式上,它創造了「科研算力銀行」這種範式。能讓機構按需取用、彈性供給。像浙江大學某重點實驗室,就通過這種方式提前 3 個月完成了氣象大模型的迭代。
并且随着技術發展,百舸也在持續的更新與迭代,比如配合 DeepSeek 推理能力推出了一些功能,包括在線推理服務的全生命周期管理、彈性擴縮容能力、自研框架推理加速技術以及完善的運維監控體系。
再者是飛槳深度學習框架,國内首個開源開放的產業級深度學習平台,工具鏈與社區屬性兼備。
它通過構建起基礎模型、工具組件、應用案例的三層資源體系,提高了諸多高校與開發者的科研效率。中國科學技術大學量子計算團隊基于飛槳量子機器學習套件,成功實現量子化學模拟加速,計算效率超越傳統方法 2 個數量級。
不過能推出如此海量的資源套件,也與百度持續深耕積累 Know-how 有關。
百度飛槳持續深耕力學與數學、材料化學、氣象預測、生物醫藥等前沿領網域,尤其是在生物計算領網域尤為顯著。
截至目前,百度已打造完整的基于飛槳的生物計算平台 - 螺旋槳 PaddleHelix,涵蓋文心大模型 - 生物計算大模型,探索 AI 技術在小分子、蛋白 / 多肽、RNA 等場景的應用。
2023 年 5 月 2 日,國際頂級學術期刊《Nature》正刊發表了百度與合作部門在生物計算領網域的研究成果——《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》,提出 mRNA 序列優化算法 LinearDesign。這是中國科技企業首次以第一完成部門的身份在《Nature》雜志發表論文。
而随着 DeepSeek、文心越來越多的模型選擇開源,飛槳的價值其實也就愈加凸顯。
開源的方式保證了研究結果的可靠性,促進了科研成果的廣泛傳播和共享。其他研究人員通過復現在已有基礎上改進和拓展,技術創新與迭代也就在這個過程中加速流動。
像某高校基于飛槳框架研發的遙感影像解譯系統,結果通過社區協作持續優化,在農作物分類任務中的準确率從 89% 提升至 96%。
還有就是千帆大模型平台,一站式 AI 服務平台。它是資深的模型專家,從模型開發、訓練、部署、監控等的全流程管理系統。
此前我們比較熟悉的ModelBuilder就是在這一平台體系下,按照自身需求來完成大模型的開發和部署。這其實是一個包含數據處理、模型精調、模型評估、量化等環節的系統性工程,對于企業而言就難度不小,對于缺乏產業實戰經驗的科研高校來說更是如此。
ModelBuilder 提供了一整套完善的工具鏈,院校根據自身科研需求深度優化模型性能。現在該平台的大模型矩陣已經覆蓋了 DeepSeek-R1、DeepSeek-V3、文心大模型等,同時支持 vLLM、LMDeploy、TensorRT-LLM、SGLang 等主流推理框架實現高性能模型托管,幫助高校可以靈活開發與部署。
而在開發與部署之前,它還能幫助科研團隊選出适合自己的大模型。
它的智能評估板塊,集成了 50 多種量化指标。在南京大學某分子動力學研究中,研究人員通過平台的 AB 測試功能,快速篩選出最優的力場預測模型,研發周期縮短 40%。
可以這樣總結,百度技術層面的部署:以算力為核心,整個全周期提供全棧技術支持。另外,在人才培養和科研創新上,百度也在發揮着自己在產業實踐方面的優勢。
比如通過「松果計劃」培養出 5000 餘名 AI 工程化人才,參與學生發表頂會論文 300 餘篇,孵化出智能天文數據處理、古生物數字復原等 20 餘個創新項目。
還有與多所高校包括清華北大、復旦、上海交大、蘭州大學等合作,開設了《飛槳 Al for Science 前沿系列講座課程》和《飛槳 Alfor Science 代碼入門與實操》兩門課程;
與清華共建「東方」智算中心,部署 2000+ 卡規模昆侖芯集群;與上海交大建設國内首個 AI for Science 科學數據開源開放平台;與北大開發「小北學長」智能體等等。
……
可以看到,百度在 AI For Science 上面的賦能是全方面的,是從全棧技術到人才培養,也是從底座、模型到應用覆蓋整個模型全周期的。
放在整個行業中,百度這一案例代表着 AI 科研的一種新基建,其核心邏輯在于将算力從孤立資源更新為智能化生產力中樞,通過全棧技術鏈重構科研工作流。
在這一過程中,企業與高校之間的合作展現出了一種新型的合作模式。
這種合作并非簡單的點對點式對接,即在某個具體項目上的短暫合作,而是呈現出立體的、動态的和多樣的特點。
他們發揮各自的優勢,比如學校的人才積累和專業數據,企業的算力底座和產業級别算法,來共同應對大模型創新與應用的各種挑戰。
就像同濟大學與百度智能雲合作,就格外具有代表性。
同濟大學作為國家重點大學,肩負了一系列重大的國家專項科研任務和工程科研突破瓶頸使命。
為了滿足同濟大學在多模态大模型、機器自主感知、多智能體和具身智能方向等前沿領網域的深度探索需求,百度智能雲提供了全面的技術支持。
以百昆侖芯 P800、百度百舸 AI 異構計算平台、百度智能雲千帆大模型平台、百度智能雲一見視覺大模型平台為基礎,打造全國產底座的具身智能大模型開發平台,服務于同濟大學圍繞特色化示範性軟體學院建設、智慧城市感知與規劃重大工程軟體技術教育部工程研究中心建設。
百舸一體機搭載昆侖芯 P800,可在單機環境下部署滿血版 DeepSeek R1/V3 全系列模型,滿足輕量化與極致效價比需求。這一方案支持 8bit 推理,并全面兼容 DeepSeek 全系列模型,提供一鍵部署、開箱即用的便捷體驗。
合作對學校多智能體系統技術的突破具有重要作用,有效提升校方多智能體強化學習算法、領網域定制大模型、協同學習算法、智能代理算法的訓練效率,并将賦能給不同場景機器人、無人機、多智能體設備等智能終端。
AI 科研新基建的構建,本質上是一場面向科研範式的底層革命。
AI For Science:從 AlphaFold 到 DeepSeek
DeepSeek R1 模型,憑借其低成本高表現的顯著優勢,在全球科研領網域迅速走紅,受到了科學家們的熱烈追捧。
比如用來探索新研究方向、日常數據處理、篩選整理科學文獻等等。
回顧 AI For Science 的發展歷程,上一次引發如此廣泛關注和熱議的是 AlphaFold。
不過 AlphaFold 聚焦在提煉生物數據的價值,其核心貢獻在于極大地提高了蛋白質以及大分子結構預測的效率,對于藥物研發、基因編輯等諸多前沿方向帶來深刻的影響。
而現在是以模型通用能力的極大提升、低成本零門檻部署的特點,帶來是整個全面科研範式的賦能。
它不再局限于某一特定領網域的數據處理和研究,而是廣泛适用于多個學科領網域。無論是物理學中的復雜模拟計算、化學中的分子反應預測,還是社會科學中的數據分析和預測,大模型都能發揮其獨特的優勢。
這種通用性使得不同學科的科研人員都能夠輕松借助其能力開展研究工作,打破了學科之間的技術壁壘,促進了跨學科研究的發展。
同時,低成本零門檻的特點讓更多科研團隊,尤其是資源相對有限的科研機構和小型實驗室,也能夠享受到先進 AI 技術帶來的便利。
此次 DeepSeek 在 AI For Science 上的賦能,标志着該領網域來到了一個新的階段。這對模型能力乃至整個科研周期的服務都提出了新的挑戰。
比如穩定的算力、比如高質量專業數據。面對不同學科領網域的海量數據和復雜問題,模型要能夠快速學習和适應,提供精準有效的解決方案。在科研全周期中,從數據采集、處理、分析,到模型訓練、驗證和應用,每個環節都需要更高的效率和質量保障。
應對這些挑戰方面,百度給出了一個參考答案。憑借其全棧的技術能力,為解決這些難題和關鍵瓶頸提供了有力支持,推動科研創新不斷向前。
從 AlphaFold 到 DeepSeek,人工智能技術發展重塑科研的未來。AI For Science 的競速才剛剛開始,需要更多國產玩家,呼喚更大的生态,實現 AI 在前沿科技的全新裡程碑。
— 完 —
一鍵關注 點亮星标
科技前沿進展每日見
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!