沈向洋，發了一個可以識别萬物的大模型

今天小編分享的互聯網經驗：沈向洋，發了一個可以識别萬物的大模型，歡迎閲讀。

作者 | 鄧詠儀

編輯 | 蘇建勳

" 講卡傷感情，沒卡沒感情。"

2024 年的 IDEA 大會上，IDEA 創院理事長、美國國家工程院外籍院士沈向洋，抛出了一句格外現實又幽默的話。

另一方面，這也展現了他對未來 AI 時代一種鮮明的樂觀情緒。

大模型的發展已經不如 ChatGPT 發布後那樣，經歷陡峭增長。進入到人類探索 AGI（通用人工智能）的第二年，大語言模型的迭代已經放緩。相應地，AI 應用、落地，占據了全球話題的中心。

但沈向洋覺得，雖然 GPT-5 尚未見身影，但算力的增長還是呈樂觀趨勢——根據 EPOCH AI 數據統計，大模型對于算力的需求，每年都是呈現四倍多的增長。

按這樣的增長速度，以往按 18 個月算力漲一倍的摩爾定律也不再奏效。沈向洋重點解釋了黃仁勳的 " 黃氏定律 "，以模型訓練來衡量算力的增長。若恒定按照一年漲四倍的算力速度增長，十年或許會預見 100 萬倍的算力需求增長。不過這一定律，仍需要時間來檢驗。

" 大模型要往前走，不單是參數擴大、模型規模大了之後，對訓練的要求變高了，數據量也要增長。某種意義上來講，對算力的需求呈跟參數的平方關系，這就是不得了的算力需求。" 他説。

沈向洋來源：作者拍攝

" 過去這幾年大家都講‘人工智能三件套’，實際上都繞不開‘算力、算法、數據’這三件事情。" 在這次大會上，沈向洋穿針引線，花了 3 個小時圍繞 " 算法、算力、數據 " 這三個方向，來介紹 IDEA 的全新進展。

視覺模型仍是 IDEA 的研究重點—— IDEA 正式發布的最新通用視覺大模型 DINO-X，可以擁有真正的物體級别理解能力。

這意味着，不像普通的視覺模型有訓練數據的限制，DINO-X 可以實現開放世界（Open-world）實現目标檢測——無需用户提示，直接就可以檢測所有物體，包括罕見的長尾物體（出現頻率低但種類繁多的物體）。

這也會大大拓展模型的落地場景。

比如，" 具身智能 " 是 2024 年火了一整年的 AI 行業話題。對于視障人士服務、服務類機器人等高難度場景，以往非常依賴大量的高質量數據标注，耗費巨量人力。但在 DINO-X 的幫助下，視覺模型可以幫助标注公司快速完成大批量的高質量影像标注或者為标注員提供自動化的輔助結果，從而降低手工标注的工作量。

來源：IDEA

對傳統的視覺模型應用廣泛的場景，DINO-X 也在自動駕駛、智能安防、工業檢測等領網域，會成為一個有力的補充，系統能夠應對各種復雜場景，識别出傳統模型難以檢測的物體。

IDEA 團隊還推出行業平台架構，通過一個大模型基座，結合通用識别技術結合，讓模型不需重新訓練，就可邊用邊學，支撐多種多樣的 B 端應用需求。

" 用一個模型解決一百萬個問題 "，是這次模型發布的關鍵理念。

有别于主流的 " 全圖理解 " 的方法，IDEA 通過在物體級别的理解上加入語言模塊，來優化大模型的幻覺問題。結合自研的 " 視覺提示優化 " 方法後，無需更改模型結構，不用重新訓練模型，也可以實現小樣本下的場景化定制。

來源：IDEA 研究院

不過，随着模型體量不斷變大，高質量數據已經成為桎梏。" 現在人工智能的發展，已經耗盡了人類社會的所有高質量數據。" 沈向洋表示。

合成數據随之而生。IDEA 團隊此次也發布了自研的語境圖譜技術，解決過往文本數據合成方案的多樣性匮乏等問題。該技術相當于是合成數據引入 " 指導手冊 "，以圖譜為綱，指導用于合成的語境采樣。

從實驗結果顯示，IDEA 團隊的方案能持續為大模型帶來能力提升，表現超過目前的最佳實踐（SOTA）；從 token 消耗來看，平均節約成本 85.7%。目前，該技術内測平台已開放，通過 API 提供服務。

在 2024 年，IDEA 在 AI 應用落地層面明顯提速。相較去年的科研論文閲讀平台，今年 IDEA 公布了更多垂直領網域的應用探索。

在預測方面，IDEA 研發了多個化學領網域專家大模型，在分子屬性預測和化學反應預測能力上，都可以達到業界領先水平。

AI 模型也可以應用在科研數據上，加快科研數據的處理速度。IDEA 新發布的化學文獻多模态大模型，就聯合晶泰科技發布專利數據挖掘平台 PatSight。這一模型将藥物領網域的專利化合物數據挖掘時間，從數周縮短至 1 小時。

而今年的一大熱門方向—— AI 編程，正是因為模型智力水平不斷提升，而成為下一個熱門的應用方向。IDEA 研究院的 MoonBit 團隊，就展示了其開發平台的編程模塊 MoonBit。這個雲原生 AI 編程工具，已具備完備的多後端支持和跨平台能力，可在硬體上直接運行，支持 RISC-V 架構，并将于 12 月正式開放。

模型也從軟體層面走到硬體層面，更多在現實世界產生效用。

坐落在大灣區 IDEA，有着得天獨厚的硬體產業基礎和優勢。這次會議上，IDEA 也一連宣布三個合作：與騰訊合作，在深圳福田區、河套深港科技創新合作區落地建設福田實驗室，聚焦人居環境具身智能技術；與美團合作，探索無人機視覺智能技術；與比亞迪合作，拓展工業化機器人智能應用。

" 低空經濟 " 則是另一個 IDEA 強調的領網域。IDEA 不僅發布了《低空經濟發展白皮書 3.0》，還發起共建 OpenSILAS 創新聯合體，與 17 家首批發起部門攜手，預期打造一個開放共享、技術領先、不斷迭代的系統和平台。

2024 年，已經是 IDEA 大會的第四屆大會。在這四年中，AI 不僅從以 CV（視覺識别）為主的 1.0 時代，跨越到以生成式 AI 為主的 2.0 時代，更是帶來了 AI 治理等下一個時代的重要命題。如今的人類社會也許需要更多思考：我們與 AI 該如何更好地共存？

"AI 的發展，能不能從經濟最大的增長，轉化到人類的最大福祉？這是在座的，在 IDEA 研究院從事技術研發的同事，以及產業落地的同事，在人工智能發展的道路上必須要去思考的問題。" 沈向洋説。