大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

最神秘國產大模型團隊冒泡,一出手就是萬億參數MoE,兩款應用敞開玩

2024-04-01 简体 HK SG TW

今天小編分享的科學經驗:最神秘國產大模型團隊冒泡,一出手就是萬億參數MoE,兩款應用敞開玩,歡迎閲讀。

國内基礎大模型創業公司,最後一位強實力選手終于正式來到台前。

它就是微軟前全球副總裁姜大昕所創辦的階躍星辰。

一年前,量子位就對這位大牛的創業動向有所耳聞。

姜大昕在微軟工作 16 年有餘,曾任職微軟全球副總裁,微軟亞洲互聯網工程院(STCA)首席科學家,全面負責微軟必應搜索的技術研發工作。但就是這麼一位風雲人物,此番創業,卻有不少令人費解的動作。

一來,他在微軟職級極高,在微軟混得風生水起,怎麼想不開創業?

二來,階躍星辰已經成立一年,但在百模群戰的 2023 年,這家公司低調得近乎隐形。不僅沒有主動對外發聲,連量子位在圈内打聽消息也探不得虛實。

現如今,大模型五虎已經初成格局,市場的注意力已經被瓜分不少,階躍星辰的亮相才姗姗來遲——會不會晚了?

會者不晚。

一出手,階躍星辰就亮出了自己蟄伏水下一年沉澱的成績:

千億模型有了,ToC 產品有了,萬億模型在路上,且通往 AGI 的路也十分明确:

走一條" 單模态—多模态—多模理解和生成的統一—世界模型— AGI(通用人工智能)"的路。

2 款 C 端產品全面開放使用

階躍星辰的產品是什麼?

不玩虛的,一露面,階躍星辰就直接帶來了 2 款面向 C 端市場的應用:

躍問和冒泡鴨,均全面開放使用。

它們一個是聊天類應用,定位個人效率助手。

一個是 AI 開放世界平台,提供海量智能體,主打一個休閒娛樂。

具體效果怎麼樣?火速注冊登錄,量子位帶大夥一睹為快。

先來看效率工具躍問。

第一輪基本問答我們讓它對比一下 ChatGPT 和 Claude 的不同,重點:以圖表形式呈現。

結果很快啊——

不止是開發公司、模型結構、檔案讀取能力這種硬性對比,也有專注方向、創新水平、安全性等偏主觀的總結,一共 14 個小項,主打一個全面:

第二輪看看聯網、信息檢索能力。

和很多大模型一樣,躍問的知識庫信息只截止到 2023 年,後面的信息自然只能現搜了。

" 今天的天氣如何 " 太簡單,我們直接問它馬斯克腦機接口公司的進展如何。

結果,準确檢索到 1 月份首位志願者植入芯片的重大事件。

不過不知道是不是對 " 重大進展 " 這一詞有不同理解,躍問沒提幾天前這位志願者可以打遊戲的報道。

我們追問之下,它倒也準确 " 交代 " 出來,包括志願者名字、玩的什麼遊戲——除了遊戲,下象棋 7 勝 4 負的事兒也一并提了。

第三輪:檔案處理。

身處 AI 科技圈,最新論文和大佬教程我們自然要緊跟步伐。

先用 OpenAI 前科學家 Karpathy 不久前的《從頭構建 GPT Tokenizer》視頻摸摸底。

直接給倆小時長的視頻目前沒有哪個大模型能直接解析,我們還是上傳字幕檔案。

很快,全英文的内容躍問刷刷刷地就總結完畢:

仔細幫大家驗證了,裏面提到的例子都有都對。用起來相當給力。

對于論文來説就更簡單了,直接給 arXiv 的鏈接就行。

一篇 8.3 萬字(基本滿足日常所需)的大模型微調方法論文(《AutoFT: Robust Fine-Tuning by Optimizing Hyperparameters on OOD Data》)丢進去,最核心的内容幾秒便可知。

至于數據處理,如下圖所示,圖片轉表格、淨增長率計算,這種需要復雜邏輯推理的任務,躍問用代碼的方式輕松解決。

最後,大家關心的多模态:

解讀表情包,easy。

挑戰一下投資機構整理的 AI 視頻公司全景圖。

别看 logo 們字體五花八門,躍問不僅迅速識别,還按照原圖歸門别類,閲讀起來相當清晰。

相比之下,有同類選手不僅識别漏洞一個接一個,格式也完全顧不上。

總的來説,説起目前市面上的 AI 個人效率助手,已經不算少。但躍問,該有的功能不僅有,在多模态、長文本理解上也能做得更好。

并且最重要的是:免費!

使用起來沒啥限制,目前也不用擔心宕機、模型 " 太累了 " 回答不出問題(手動狗頭),所以完全不失為一個優秀的平替。

至于冒泡鴨,它有 app 版也有 web 版。

平台上載有各種由多模态大模型驅動的智能對話體,可以進行各種有趣的對話、也可以探索有趣的劇情互動遊戲(" 戲精 " 們有福了)。

實在不夠,還可以自己上手創建:

官方也提供了非常詳細的上手文檔,包教包會。

我們淺試了《逃離精神病院》這一劇情。

和 AI 的對話相當流暢、沉浸,讓人一不小心抬頭看時間才發現已經玩了好久。

(不瞞您説,量子位開了好幾輪都沒能成功逃出 " 精神病院 ",難度還是有億點點的。)

對于大模型產品,姜大昕表示:"我把模型和產品的關系比喻成靈魂和皮囊。大家一定聽過一句話,好看的皮囊千篇一律,有趣的靈魂萬裏挑一。我們希望靈魂能更加有趣一點,才能顯示出產品的不同。"

那麼,躍問和冒泡鴨背後的 " 靈魂 " ——大模型們長什麼樣?

" 鐵人四項 " 攀登萬億參數模型

冒泡鴨和躍問的背後,是階躍星辰已經成熟的兩款千億參數大模型。

該公司将其稱為 Step 系列通用大模型,分别是 Step-1 千億參數語言大模型,以及 Step-1V 千億參數多模态大模型。

一路看來,階躍星辰訓模型的路,走得出奇的順。

去年 7 月起,研發團隊正式開始訓練模型。

2 個月後,綜合性能超過 GPT-3.5 的千億參數大模型 Step-1,一次性訓練成功。

在大模型遍地開花的時代,聽起來擁有一個模型并不是什麼難事,但短時間内一次成功,這種效率仍然令人咋舌。

姜大昕把原因歸結于兩點。

一是團隊本身在 AI 領網域有經驗和積累;

二是創業公司團隊精悍,能對訓練中遇到的問題及時溝通與反應。

這次成功極大地鼓舞了團隊的信心," 這驗證了我們的方法是正确的。"

再 2 個月後,也就是去年 11 月,千億參數的多模态大模型 Step-1V又告成。

Step-1V 大模型可以精準描述和理解影像中的文字、數據、圖表等信息,并根據影像信息實現内容創作、邏輯推理、數據分析等多項任務。此外,它還能理解視頻中的内容。

上海人工智能實驗室推出的大型模型評估平台 " 司南 "(OpenCompass)多模态模型評測榜單顯示,階躍星辰研發的 Step-1V 位列第一,性能比肩 GPT-4V。

" 千億參數的 GPT-3.5 模型是一個重要的分水嶺。" 姜大昕表示。

模型要達到 GPT-4 的萬億參數規模,各個維度的要求都上了一個台階。

譬如,訓練萬億模型需要等效 A800 萬卡單一集群,進行高效穩定的訓練;需要十萬億 tokens 的高質量數據;需要駕馭好新穎的 MoE 架構。

姜大昕稱,以上幾點,無論是有哪一點有所不足,都會導致 Scaling Law 難以向上攀登。

但是!

就在前幾天的全球開發者先鋒大會開幕式上,階躍星辰又給出了萬億參數 MoE 語言大模型 Step-2的預覽版——這也是國内初創公司,首次交出的萬億參數模型答卷。

姜大昕介紹,Step-2 從去年 12 月啓動訓練,目前訓練穩定,待完全訓練完畢和打磨成熟。

" 我堅信 Scaling Law,(會)訓練更大模型。" 姜大昕談到,團隊追求的是多模理解和生成的統一,"Step 系列大模型将為多模理解和生成的統一奠定堅實基礎。"

基于實踐經驗,團隊把攀登 Scaling Law 稱為一個 " 鐵人四項 " 般的超級工程。

哪四項?

算力、系統、數據、算法。

而階躍星辰自然有自己熟稔的打怪套路。

算力方面,通過自建機房 + 租用算力,積極進行算力儲備;

系統方面,團隊核心成員實踐過單集群萬卡以上的系統建設與管理,訓練千億模型的 MFU(有效算力輸出)達 57%;

數據方面,數據團隊核心骨幹出身必應搜索引擎,曾支持全球 100 多種語言,為 200 多個國家和地區提供服務,對全球互聯網高質量語料的分布有深入了解,并建立起強大的數據處理和知識圖譜流水線;

算法方面,團隊不僅能駕馭各種架構,比如萬億參數的 MoE 架構,而且對大模型的認知以及發展路線有深刻洞察。

不想只在時代的風中凌亂

面對鐵人四項和多模态融合之路,階躍星辰就這麼默默進發了一年。

那麼,是什麼樣的團隊行進在這條 Scaling Law 之路上?

量子位得知的消息是,階躍星辰現在已經有一支 150 多人的隊伍。

領隊者姜大昕,現任階躍星辰 CEO,同時也是團隊算法負責人。

2005 年,姜大昕獲紐約布法羅州紐約州立大學計算機科學博士,在機器學習、數據挖掘、自然語言處理、生物信息等領網域有豐富的經驗和工程經驗。

博士畢業後,他先後任南洋理工大學擔任助理教授,MSRA(微軟亞研院)研究員。

2011 年開始,姜大昕轉入微軟亞洲互聯網工程院(STCA)工作。

該中心主要負責微軟全球產品的研發工作,包括必應搜索引擎、智能語音助手 Cortana、Azure 認知服務以及 Microsoft 365 的自然語言理解系統等。

去年 3 月,姜大昕正式升任為微軟副總裁,同時兼任亞洲軟體技術中心 WebXT S+D(網絡體驗、搜索和分銷)集團總經理。

——是的,你沒聽錯,剛剛被升職,明明可以在微軟幹到退休,卻跑出來創業了。

" 在微軟,只能基于 OpenAI 的模型做工作。" 姜大昕回憶,即便是微軟和 OpenAI 的關系,使用其模型也只能調用 API,對黑盒裏的秘密、模型算法的修復 / 迭代建議,完全插不上手。

我當時感覺整個世界在我身邊呼嘯而過,都在往前衝,我在原地很茫然,留下自己在風中凌亂,我不知道我在幹什麼。

琢磨再三,姜大昕決心不能再被動地風中凌亂。

于是,離開微軟;于是,躬身入局。

有了創業想法的姜大昕,與現在階躍星辰的數據負責人焦斌星" 密謀 " 兩個多小時,一拍即合。

焦斌星同樣出身微軟,是中科大和 MSRA 聯合培養博士。

博士畢業後,焦斌星正式入職微軟,是微軟必應引擎核心搜索團隊前負責人,日常工作主要是利用數據挖掘和 NLP 算法優化索引和搜索質量;也曾開發全球高質量站點的自動挖掘算法并用于索引和排序。

還在微軟時,他二人就聽説過外界盛傳大模型時代的 " 數據荒 ",即 Scaling Law 所需的數據不夠用了。

當時,他們不以為然。有搜索引擎背景在,眼見互聯網有上億、上萬億的網頁網站,怎麼會不夠用?

等到自己置身其中時,發現是真的不夠用(笑死)。

好在現在既可以從多模态數據中挖掘更多數據,也可以像 OpenAI 訓練 Sora 那樣使用人造數據。

核心團隊的另外一位成員,朱亦博,此前擁有多次單集群萬卡以上的系統建設與管理實踐經驗。

他博士畢業于美國加州大學聖芭芭拉分校,曾任微軟研究院研究員。

在這一波浪潮襲來之前,他的工作主要面向大規模系統以及超高速度性能網絡。

2018 年,他任職字節跳動,負責公司 AI 基礎設施與基礎 AI 框架,開始積累萬卡集群的搭建經驗;2022 年底,他離開字節,跳槽至 Google 任高級主管,直接支持 OpenAI 最大勁敵、Claude 的背後公司 Anthropic。

可以説,階躍星辰三位核心骨幹的經歷十分相似,就是第一階段(博士期間)進行相關研究,第二階段進入大廠在一線打拼,一直都在和 AI 的最新進展親密貼貼。

當 ChatGPT 引領的大模型時代開始時,他們都意識到這是一個大變革,因此以最快速、最靈活、最全面的方式投身變革當中。

如果 AGI 是一個需要長期攀登的山峰,看到正确的路徑,建立正确的能力,比早走幾步更加重要。

One More Thing

最最最後,階躍星辰的個人效率助手躍問,剛剛上線了一個很贊的新功能。

叫一圖讀懂。

説大白話就是丢給它一個文檔,就能一鍵生成解析重點的長圖文

這是此前的 ChatBot 沒上線過的功能,想要體驗的朋友們,速去喲~

—  完  —

點這裏關注我,記得标星哦~

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~  

>
熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們