今天小編分享的科技經驗:帝都魔都雙雙押寶,年底了AI圈居然還有高手?,歡迎閱讀。
好好好,本以為 OpenAI 直播已經是 24 年 AI 領網域的尾聲,沒想到還有高手,國内 AI 圈又傳出個大新聞。
就在前幾天,國產 AI 六小虎中的階躍星辰,拿到了數億美元的融資。
而且更值得一提的是,這輪融資的背景可不簡單,差評君還從投資方裡找到了上海國資的身影。
要知道就在幾天前,北京國資也投了六小虎中的另一家智譜。
一南一北兩大超級城市,各自押寶,都上了賭桌。
有一說一,經過前段時間的 " 百模大戰 " , AI 在融資圈兒其實是有些降溫的,結果這次兩大國資先後出手:
這一波,難不成是大模型版的滬爺 VS 京爺?
雖然話是這麼說,估計一些網友還是對 " 階躍星辰 " 的名字有點陌生, " 這又是從哪冒出的大模型公司? "
但其實在圈兒内,階躍星辰早就小有名氣,不過倒也不怪大家沒聽過,主要這企業确實比較低調。
相對其他AI 創業公司,階躍是六小虎裡最後出場的,但在登場時,就已經是獨角獸的存在了。
如果要用一句話來形容的話,差評君能想到的就是 " 低調神秘有實力,國資背景大牛多 " ,是國產 AI 裡的一匹黑馬。
不僅在首秀時,階躍星辰就掏出了個對标 GPT-4 的萬億參數模型,而且主打一個速度快、效率高, 10 個月内就發布 11 款模型,并且在 16 個月内,就搗騰出了從理解到生成的全系列模型矩陣。
雖然人家确實挺有實力,不過咱這次的重點倒不是純講這個。
差評君覺得借着拿階躍星辰融資這事,還是有挺多有意思的 AI 圈内故事,能和大家聊聊的。
首先不可否認的是,大模型領網域實際已經在縮決賽圈兒了。
差評君也和不少圈内人聊了聊,發現大家基本都在從兩個點,來判斷這家公司有無能吃雞的冠軍相。
一個是有沒有牛逼的人才,另一個是能不能堅持投入技術研發搞 AGI 。
咱先說人才,其實大模型的人才圈兒,可能比差評君的朋友圈還小。
就拿今年諾獎得主喬弗裡辛頓來說,他這個深度學習之父的實驗室,一向就是各大公司眼中的頂級宗門。
像什麼 OpenAI 聯合創始人伊利亞,就是他的博士;谷歌 DeepMind 的大佬阿列克謝,是他的博士後;
Meta 的人工智能負責人楊立昆也是他的弟子;前百度首席科學家吳恩達,也跟他有千絲萬縷的關系。
而在國内,被北京國資選中的智譜 AI ,實際上也是學術上的大宗門出身,直接來自有 27 年人工智能研究歷史的清華大學知識工程實驗室。
所以說,有沒有這些牛逼人才,往往是行業内認不認可一家公司的理由之一,甚至有時候請這些圈内大牛,要比花錢買顯卡搞計算還重要。
前不久,差評君就和某大模型一線技術人員聊了聊,他用前不久字節高薪挖阿裡通義大模型技術負責人周暢的新聞舉例,告訴差評君目前圈内人才急缺。
他覺得傳聞中花費 8 位數薪資挖人的操作,是可以理解的。
因為大模型訓練成本動不動就是幾千萬上億,而合适的人才,能少走很多彎路,反而是最省的操作。
而這次的階躍星辰,差評覺得它能被資本看好,也和人才脫不了幹系。。。
不過與學院派京爺智譜不同,滬爺階躍這方面也很特色,很多人都是行業内老人了。
他們裡面很多研究人員都是從讀博士開始搞相關領網域,然後在大廠工作過,親身在一線經歷了過去 10 年 AI 的最前沿發展。
比如階躍星辰的創始人、CEO 姜大昕,這哥們以前是微軟前全球副總裁,日活上億、備受差友們喜歡的 Bing 搜索,還有全球最早的智能個人助理 Cortana ,都是他曾參與過的項目。
這麼說吧,他把深度學習技術應用到了 Bing 上,幫助 Bing 搜索服務擴展到全球 200 多個國家和地區。
除了CEO ,階躍的首席科學家張祥雨,在這個圈子裡也很有名。
這老哥本來是西交跟微軟亞洲研究院的博士生,師從孫劍和何恺明,還是開山大弟子。
但這還不是重點,重點在于讀博期間,他們師門四人完成了——引用次數幾十萬、本世紀最火的深度學習著名論文—— ResNet ( 殘差學習 ),而張祥雨在裡面就負責了底層框架和編碼。
有的差友可能不了解這個 ResNet ,沒關系,重點就一句話,這文章的核心思想殘差網絡,對現代深度學習影響巨大。
當年打敗八冠王捷豹的 AlphaGo 系列,就用了 ResNet 技術;現在的 Transformer 網絡( GPT 裡那個 T )裡,同樣也用了殘差網絡。
除了這個,張祥雨在其他技術上也很牛逼,在這咱就不細說了。就說一個蘋果的 3D 人臉解鎖,也就是 FaceID ,那其實也是受他的 ShuffleNet 技術影響才搞出來的。。。
總之,這個 2023 年 4 月才建立的團隊,在六小虎裡亮相最晚,但人才的實力卻絲毫不虛,從這點上看,能拿到魔都的投資也不算奇怪。
然而另一方面,除了人才以外,大模型廠商路線的選擇,也越來越受重視。
而 AGI 基座模型這方向,其實也是技術理想主義者們最興奮的方向,是大部分創業者入局大模型領網域的初心所在。
換句話說,基座大模型就是那一層地基,只有地基扎實了,模型的基礎能力逐漸提升了,才有可能在未來搞出能真理解世界的通用模型,并運用到各種場景中改變人們的生活。
像是 OpenAI 、 Google 、 Anthropic 、 Meta ,還有國内的智譜、階躍等,就屬于這一派,在堅持推出各類 AI 應用的同時,也依舊在基座大模型的探索上越走越遠。
然而就像開頭說過的,整個 AI 領網域其實有些降溫。
不少初創廠商們因為成本上的壓力,逐漸擱置了基座大模型的研究和探索,把重心放在 AI 應用上。
要麼轉向垂直行業賽道、要麼單純搞 toC 的生意來賺錢,畢竟要先活着才能去實現理想。
而在 2024 年,國内依舊在不斷更新基座模型,依舊在公開場合重申 AGI 為最終目标的公司裡,智譜和階躍星辰算是很典型的代表了。
幾個月前,差評編輯部就跟智譜的 CEO 張鵬對話過。張鵬表示:我們的目标定在 AGI ,這裡面每一個問題的突破都有可能帶來飛躍式的發展。
包括階躍星辰也一樣,階躍的創始人姜大昕曾經說,高昂的訓練成本的确是一個挑戰。有人調侃 " 講卡傷感情,沒卡沒感情,用卡費腦筋 " ,但如果追求的目标就是 AGI 的話,付出再多也還是要堅持下去。
姜大昕給階躍星辰設計的技術路線中,就抽成 " 單模态 - 多模态 - 多模理解和生成 - 世界模型 -AGI" ,一共五個步驟。
這可能也是階躍的大模型系列之所以被命名為 Step 的原因,五步成詩。
到了現在,階躍星辰已經走出了兩步。
階躍的第一步,就是萬億參數大模型 Step-2 ,它在上個月就炸場了一番。
在圖靈獎得主楊立昆親推的權威榜單,有 " 全球最難大模型評測 " 之稱的 LiveBench 上,Step-2 拿下了國内第一、總榜第五的成績,成了唯⼀進⼊前⼗名的中國語⾔⼤模型。
榜單成績時間:2024-11-19
而階躍的 " 第二步 "Step-1V 走的也不錯。
拿⼤模型競技場 Chatbot Arena 的數據來看,這個競技場網站裡網友們可以試用所有的大模型,然後給它們打分,今年 11 ⽉的榜單裡 Step-1V 的總分已經達到了 Gemini1.5 的水平。
除了這些,在 C 端應用上這家公司也做出過一些出圈的產品,就比如主打拍照識别的躍問 app 。
他家的躍問拍照問,也是最早接入 iPhone 16 相機控制的國產大模型功能。
還有一上線就快速衝上 App Store 美食榜前三的胃之書,用的就是階躍的多模态大模型;
今年在圈内爆紅的 AI 小遊戲換你來當爹、靈魂提取器,也是基于階躍模型能力開發出來的。
像是界面财聯社這些财經垂類的專業媒體,也跟階躍做過 AI 合作。
但歸根結底,階躍星辰給人最深的感覺,還是在低調有實力,和堅持着 AGI 初心這兩點上。
而這,或許就是上海國資之所以選擇它的另一個原因。
最後,差評君覺得在 AI 領網域逐漸降溫的 2024 年末,智譜和階躍星辰兩家先後拿到了國家隊的投資,這對國產 AI 行業來說也是一個比較重要的信号。
一方面,這意味着行業内的方向已經開始逐漸清晰,最頂端國家隊的層面,也希望能盡快看到 AGI 。
而另一方面,這也可以說是拉開了國内大模型下半場的序幕:
擁有人才、找準方向、能堅持到最後的人,才有機會向人工智能的 One Piece —— AGI 進軍。
撰文:納西