大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 互聯網

湖南95後女博士,力挑谷歌,要造思考時"不發燒"的AI

2025-03-20 简体 HK SG TW

今天小編分享的互聯網經驗:湖南95後女博士,力挑谷歌,要造思考時"不發燒"的AI,歡迎閲讀。

作者丨黎曉梅

編輯丨劉恒濤

一個饅頭的熱量 ( 約 20 瓦 ) ,就能完成需要上萬瓦電力的運算?

這是陸兮科技衝擊的目标。陸兮科技在 2023 年由兩位 95 後女性創立,是國内首家 " 類腦計算生态鏈 " 企業。2024 年,陸兮科技推出了首個非 Transformer 架構、采用類腦技術路線的國產自研大模型— NLM 模型。NLM 模型高效低能耗,推理效率提升了數倍,能耗卻降低了 80% 以上。

目前,該模型已通過國家網信辦 " 生成式人工智能服務 "、" 深度合成算法服務 " 兩項備案,獲準上線公開運行。

作為 Transformer 架構的挑戰者之一,陸兮科技以類腦算法搭建全自研架構,力争突破 Transformer 的技術壟斷,以及對英偉達等高制程芯片的依賴。在宏大的目标前,陸兮科技的底氣何在?

挑戰 Transformer 做主權 AI

2017 年谷歌提出的 Transformer 架構,帶動了新一輪 AI 工業革命。通過自注意力機制和位置編碼,Transformer 成為了大模型主流算法底座,引領了 AI 的未來。

但如今,Transformer 的影響正在減弱。由于計算復雜度高、訓練和部署成本居高不下、依賴高性能的 GPU 和大量存儲空間,Transformer 架構所需的算力競争難以為繼。

陸兮科技創始人兼 CTO 周芃舉例,Transformer 遵循暴力解法,每推出一個新的 Token,就必須回溯所有的 Token。就像是讓 AI 讀了一本書,之後每回憶書中的部分内容,AI 就要把全書内容全部再讀一遍,由此帶來了大量算力消耗。

一場針對 Transformer 架構的挑戰正拉開帷幕。挑戰者包括微軟和清華推出的 RetNet;卡内基梅隆大學和普林斯頓大學研究團隊推出的 Mamba;華中科技大學、字節跳動和香港大學推出的 Liquid 架構等。

挑戰者有一個共同的思路:讓底層架構算法降本增效。周芃認為,陸兮科技采用的 " 類腦算法 " 技術路線具有顯著優勢。" 人工智能的浪潮,最初是由大腦的啓發開始的。人腦是當今運算能效比最強、能耗最低、成本最低的計算單元。目前人工智能領網域的頂尖學者們都有一個共識,他們認為下一代人工智能是向大腦靠齊的。"

類腦架構的本質,是模仿人腦的神經元結構和功能,實現高效的運算與存儲機制。和 Transformer 的暴力解法不同,人腦在運算時僅調取直接相關的神經元,其餘神經元處于休眠狀态,這樣就能減少無效計算。還是以讀書做比喻,類腦架構大模型可以直接定位到相關章節,無需從頭到尾再讀一遍。

圖:類腦模型的參數量級 + 款型

" 我們大腦只耗 20 瓦的功耗,但現在的算力中心,搭載 Transformer 架構大模型,完成同樣的計算,可能耗上萬瓦的電。類腦計算是下一代 AI 的關鍵。" 周芃表示,Transformer 是驅動了上一輪 AI 工業革命的蒸氣機,但其已過時。新一代類腦架構才是真正能夠帶領人類走向通用人工智能的高速鐵路。

周芃是湖南人,1996 年出生,16 歲考上華中科技大學啓明實驗班,2022 年,在加州大學聖克魯斯分校獲得博士學位。畢業前後,周芃在多家海外頂尖實驗室與人工智能企業工作,進行類腦智能研究。她發表了多篇論文,獲得了多項專利,在多個頂級期刊和會議擔任審稿人,還是多個海内外開源大模型社群的核心貢獻者與首要研發者。

周芃的研究興趣橫跨類腦硬體設計與類腦軟體算法,在軟體硬體雙向定制研發、交叉賦能、提升 AI 軟體硬體匹配程度上取得了全球獨家學術成果。2023 年,國際電氣電子工程師協會(IEEE)向周芃頒發了電路與系統領網域年度最高學術獎項 " 達靈頓獎 "(The Darlington Award)。時年 27 歲的周芃,是該獎項設立以來最年輕的得主。

周芃一直關注國内主權 AI 的發展,加上西方國家對華裔科研人員的區别對待,她決定回國創業。周芃認為,在國際 AI 競争的大背景下,中國必須做主權架構模型。" 為什麼有安卓,我們還要做鴻蒙?為什麼有英偉達,我們還要做昇騰?自研架構是主權問題。"

2023 年,周芃和學生時代結識的好友汪博倫,一起回國,在深圳成立公司,汪博倫任 CEO,周芃擔任 CTO。公司名字 " 陸兮科技 ",取自第一位直立行走的人類 "Lucy"。

打破對英偉達的依賴 能耗降低 80%

類腦架構的落地,是一場橫跨算法、芯片與半導體的 " 極限挑戰 "。算法上,要模拟人腦的稀疏計算;芯片設計要存算一體,還要突破國產低制程芯片的性能瓶頸。

" 傳統的 AI 以數據驅動為主,但人腦的計算和存儲不是完全分開的,大腦是存算一體的結構。" 周芃説道。因此,陸兮科技的業務涉及類腦架構搭建、大模型研發、存算一體研究,以及類腦硬體開發。

然而,類腦架構的算法、芯片,乃至半導體都存在瓶頸。周芃説,現在是摩爾定律的黃昏,但做類腦架構的大模型,就要将算法、芯片的難點全部同步突破。

陸兮科技有一支具備芯片 - 算法協同設計經驗的團隊,團隊成員來自加州大學聖克魯茲分校、麻省理工大學、清華大學、華中科技大學、電子科技大學、中國地質大學等海内外高校,擁有谷歌、中美相關類腦芯片公司的工作經驗。通過 " 自研芯片 "+" 軟硬适配 " 的思路,陸兮科技試圖打破大模型對英偉達芯片的依賴。

一方面,陸兮科技在國產成熟制程上研發了大模型定制化 FPGA 芯片,在先進制程上研發了性能強大的大模型 ASIC 芯片。通過元器件層面的存算一體集成,實現元器件合二為一,打破 AI 芯片性能 " 唯制程論 ",喚醒了成熟芯片的性能冗餘,用國產 AI 芯片走出了一條突圍之路。

另一方面,陸兮科技與華為、海光等芯片廠商和全國各地的超算、智算中心積極聯動,開展模型 + 芯片軟硬體一體化适配,讓類腦架構能在鋪貨量極大的國產成熟芯片上跑起來。

圖:陸兮科技智能硬體產品

2024 年 2 月,成立一年的陸兮科技,完成 " 類腦大模型 " 底座模型研發,随後推出了全流程自主研發的 NEURARK 類腦架構。基于 NEURARK 類腦架構,陸兮科技研發了底座模型、通用模型、行業垂類模型、端側離線模型等多條產品線,滿足不同行業的場景的多樣化需求。

與 Transformer 架構相比,NEURARK 類腦架構運用稀疏激活機制、隐狀态管理、無矩陣乘法架構等核心技術,精準復刻大腦運算與存儲機制,讓大模型像人腦一樣,僅激活相關神經元進行計算和存儲,從而減少無效計算。

這樣的架構,在算力消耗、能源消耗、存儲占用、上下文長度、問答響應延遲等多個維度,實現了數倍的性能提升。

周芃説,NEURARK 類腦大模型在推理效率上較傳統模型提升數倍,能耗降低 80% 以上。這一優勢使其在低制程芯片上的部署表現更為突出,大模型可在包括 FPGA 在内的低制程 + 低功耗芯片上,實現 10B 量級的大規模部署。這對于降低大模型算力與能源消耗、打破芯片行業壟斷有重大意義。

" 我們的類腦模型產品線,每款產品都有一個最鮮明的特點:不需要英偉達的 GPU 就能跑得動。" 周芃介紹," 陸兮科技的大參數量級模型,在傳統的 CPU 集群上能運行;終端的中級參數量模型,能在筆記本和家用電腦的 CPU 上運行;而端側小模型,在手機處理器上就能跑。"

全流程自主研發的類腦架構,确保了技術的自主可控,避免了對國外技術的依賴。目前,陸兮 NLM 類腦大模型,通過了國家網信辦《生成式人工智能服務備案》、《深度合成算法備案》,是我國首個采用類腦技術路線、通過兩項備案、獲準上線公開運行的國產自研底層架構大模型。

賦能千行百業 衝擊 6000 億參數規模

"AI 的未來不是快速地流量變現,而是用最前瞻的科技研究、最穩定可靠的智能產品、最豐富普适的功能,創造新質生產力,賦能千行百業高質量發展。水利預測、醫療康復……這些才是國家真正的需求。" 周芃説。

目前,陸兮類腦大模型已在醫療、康養、水利、能源、安防、消費電子等 20 餘個基礎設施行業實現全面預部署,與中國電子、水利部長江水利委員會、聯通、中國田徑協會等多個國央企、行業頭部企業合作。其中,陸兮科技類腦醫療大模型已在多家三甲醫院、醫聯體網絡醫院與重點科室實現全面部署。

在這些應用場景中,陸兮科技的類腦大模型,有效提升了工作效率和準确性。例如,通過對洪澇災害進行預報、預警、預演和預案,提高了災害預警的科學性。

與國央企共同研發推廣通用醫療大模型、糖尿 + 甲乳專病大模型,提高了診斷的準确性和效率。

在端側,陸兮科技 "NLM-GPT" 剛亮相時,僅需使用手機自帶處理器與存儲硬體,能在一台普通安卓手機的離線模式下運行,完成工作與生活中的各項任務。

目前,陸兮科技的端側大模型,已成功部署在手機、手表、手環、耳機、電視、會議設備、智能家居等終端設備中,并在百元級的消費類電子產品中實現 100% 離線端側部署。

圖:架構的核心技術説明

在陸兮科技,女性員工數量超過了一半以上,公司致力于性别平等,提倡員工共同養育子女、處理家庭事務,打造一個更包容、支持女性的工作環境。" 女性從年輕時就經歷了無數挑戰,形成了強大的韌性,遇到各種艱難險阻,我們都能逢山開路,遇水架橋。陸兮科技創始人的女性身份,對于公司長期、穩健、可持續發展,是極大的優勢。" 周芃説。

研究顯示,人腦的突觸連接總數在 100 萬億左右,相當于 100 萬億的參數規模。而當前最先進的 GPT-4 參數規模約為 1.8 萬億,和人腦參數規模差了 55 倍。

目前,陸兮科技大模型的參數規模為 580 億。周芃透露,公司正在衝刺下一量級的規模,預計 2025 年将大模型參數規模提升至 6000 億。

周芃認為,類腦架構将會厚積薄發,轉捩點就在于模型參數規模的擴大,直到逼近人腦的規模。

"Transformer 是近年來發展最快的架構,但之後會趨向平緩。類腦架構在緩慢發展後,将迎來爆發。" 周芃對未來的發展信心滿滿。

本文為創業邦原創,未經授權不得轉載,否則創業邦将保留向其追究法律責任的權利。如需轉載或有任何疑問,請聯系 [email protected]。

熱門排行
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們