今天小編分享的财經經驗:量化卷大模型,還有意義嗎?,歡迎閲讀。
風評轉向很快,量化從股市敵對勢力到掀起科技國運,僅用了一年時間。
DeepSeek R1 的開源,幾乎拉齊了中美大模型的代差,也重塑了量化行業的公眾形象。對于過去兩年深陷某種道德困境的量化私募行業而言,AI 實驗室成為了當下一個不可忽視的風口。在巨大的社會價值面前,擴招的消息一個接着一個。
寬德 Will Lab 招募 AI 工程師,鳴石創世紀 AI Lab 招募 AI 科學家,蒙玺 AI Lab 招募機器學習實習生,黑翼、磐松、正定、啓林、世紀前沿近期也加入 AI 搶人之争。
而頭部量化之間,這場 AI 軍備競賽其實早已暗流湧動。
眾所不周知的是,明汯已囤了數千張 GPU 卡,數萬張 CPU 核,在金融數據的應用場景下 AI 算力可以達到 400P Flops;九坤更是與微軟亞洲研究院復現了 DeepSeek R1 模型,在此之前低調建立了 Data Lab、AI Lab、水滴等多個 AI 實驗室。
看起來 DeepSeek 已不僅是資本市場信心重啓的重要催化劑,更變成了一些量化私募的 OKR,激勵他們以更重要的角色參與到時代進程裏。
只是在與多位量化管理人交流後,筆者感受到一種温差:如火如荼的投產之下,各大建立 AI 實驗室的量化在大語言模型能力上距離 DeepSeek 還很遠。反過來,DeepSeek 目前對量化投研的幫助也十分有限。
整個量化行業,集體投入到建設 AI 實驗室的熱情中,真實意圖并不只是技術理想主義的追求。
量化難有下一個 DeepSeek
開年以來,機構盡調量化私募時會多問一句,「你們家有多少張卡?」
雖説算力儲備難與投資能力扯上多少關系,但在很多盡調機構眼裏,卡的數量一定程度反映了量化私募的做成大模型的概率,對于一些銷售機構而言,這也是衡量量化私募未來的某種标尺。
但一個顯而易見的現實是,大多數量化私募目前并沒有足以支撐做大模型的算力。
大模型的算力門檻相當之高。幻方是全國為數不多萬卡集群的公司,2021 年,幻方對「螢火 2 号」AI 集群投入 10 億,搭載了 1 萬張 A100 顯卡。2024 年,DeepSeek V3 官方報告訓練大模型使用了 2048 塊 H800 GPU 集群。中存算董事長陳巍測算,幻方實際的卡數 2.78 萬張(A100+H20)+2048 張 H800,大概在 3 萬張左右的規模 [ 1 ] 。
多數量化私募并不具備如此闊綽的家底。
一名上海百億量化管理人向遠川透露:「當前購入大量先進顯卡難度非常大,且成本高昂,建設大模型算力投入至少數十億,這就要求量化每年至少有 10 億利潤。即便如此,人才成本、時間成本、團隊磨合成本都不可忽略,未來幾年基本不可能再出一個 DeepSeek,彎道超車難度巨大。」
另一名百億量化老板告訴遠川,目前在算力和利潤上符合做大模型條件的另外兩家量化,只有九坤和明汯,「九坤規模體量足夠大,而且比較學院派,跟清華北大聯系密切,有足夠的人才供給。」但據遠川了解,九坤與幻方的方向并不相同,相較基礎模型,他們更關注垂網域模型并推動 AI 在應用領網域的落地。
「而明汯,我覺得搞大模型不像老裘的風格,老裘還是希望在金融領網域與國際頂級對衝基金競争。」
簡言之,量化做大模型最大的兩個門檻是算力密度和人才密度,這兩者與鈔能力休戚相關。比如幻方沒有融資的顧慮,擁有大部分量化以及大部分 AI 創業公司都難以企及的「造血能力」。
這種「造血能力」創造了松弛的研發環境,DeepSeek 160 人研發團隊基本是沒有海歸背景和大廠背景的年輕人,BOSS 直聘上 DeepSeek 招募的深度學習研究員年收入高達 176 萬,超越了降薪背景下很多公募投研。在優渥待遇的前提下,研發人員還能從容地獲得源源不斷的輸血支撐算法行業的巨量失敗。
超額衰減的當下,多數量化自身規模尚不算殷實,面臨着未來更激烈的内卷,更沒有在芯片出口管制之前低價囤上數萬張卡,錯過了财富積累的黃金時間。
就算具備一切現實要素,創始人沒有利潤之上的價值取向也很難維系持續的重金投入,就像朱嘯虎溢于言表的贊美,「梁文鋒的想法确實不一樣,他連幾個億的用户都不要,任何考慮賺錢的角度都太世俗了。」
蒙玺投資告訴遠川,量化做大模型的視窗期已經過去了。「做這個的價值在哪裏?DeepSeek 是開源的,在他們的基礎上改一改代碼然後讓大家眼前一亮,怎麼可能?」
DeepSeek 對投資幫助有限
DeepSeek 橫空出世以來,金融行業彌漫了一層焦慮,量化私募運用 DeepSeek 先進生產力,好比給本就強悍的策略增添了核動力。量化集體建設實驗室加碼 AI,也意味着僅剩不多的超額未來或許會被加速榨幹。
倍漾量化 CEO 馮霁判斷:「三年内不使用 AI 的量化基金勢必遭淘汰。」在他看來,DeepSeek 是向那些仍然不相信 AI 力量的人,作最後一次的呼籲 [ 2 ] 。
除了互聯網行業,資管行業數十家機構已争先恐後地「接入」DeepSeek。中金測試其量化選股能力,發現 2024 年以來 671b 标準版 DeepSeek-R1 在行業輪動上有穩定超額 [ 3 ] 。大模型極大提高量化中後台制作路演材料的速率,VS Code+Github Copilot 比炸雞配啤酒還香。
雖然行業一片歡呼雀躍,但客觀看 DeepSeek 在投研上的主要應用于兩個維度,與其他大模型沒有實質區别:
一是輸入端拓寬另類數據獲取方式。DeepSeek 能分析新聞研報文本、語音、視頻多個另類數據源,有很強的信息處理能力,不僅能從新聞中獲取情緒因子,對專家訪談的回答質量也能定性判斷。
鳴熙資本基金經理陳昊炜,曾就職于美國對衝基金 Point 72。他想起一個有意思的細節,當上市公司高管回答投資者問題時,Point 72 創始人 Steve Cohen 喜歡聘請 FBI 的專家來對他們的微表情進行判斷,觀察他們表達是否自信,話語是否存在貓膩。諸如此類的細節,為美劇《億萬》打造主角提供了非常多的原型參考。
「具備多模态的能力的大語言模型能通過微表情變化進行情緒判斷,把非結構化數據轉變為結構化數據。」陳昊炜説。
二是輸出端提高編程的效率。平方和投資對遠川表示,最直觀的變化是 DeepSeek 降低了投研人員在接觸新的編程語言時的門檻,「VS Code 等編輯器也集成諸多 AI 插件,實現從代碼靜态分析到動态優化建議的全鏈路賦能,便于編程人員的代碼分析、優化和管理。」
DeepSeek 是能夠對代碼層面的重構、金融語料的訓練、另類數據的處理等投研流程提效增速,但百億量化龍旗科技告訴遠川,「至少目前而言,大模型處理的精細度還遠遠達不到我們的實際要求。」龍旗認為通過基本面研究,結合機器學習特别是深度學習來處理數據構建模型,對他們來講比運用大模型更具實踐意義。
蒙玺投資很早在本地部署 DeepSeek,最大的用處是輔助編程,「通俗來説就是找 BUG。」如果研究員 Prompt 寫的足夠好,還可給 DeepSeek 喂研報,讓它自動去做因子。「不過在精細化層面,比如模型預測這塊我們是不太可能讓 DeepSeek 參與太多。」
對于絕大多數量化私募來説,DeepSeek 等大模型對量化投資的實盤幫助有限。
從過程來看,大模型在處理文本及其邏輯上優勢明顯,量化投研則是數據處理上有更大需求,輿情類因子占比不大;從結果來看,DeepSeek 有幻覺和生產内容随機性的局限,模型輸出結果未必符合現在量化投研的嚴謹要求。
即使不聚焦 DeepSeek,AI 整體對量化也無法起到決定性作用。目前量化管理人的 AI 能力和基金的未來業績并沒有直接的正相關系,否則幻方就是業績最好的量化的基金。
AI 作為一種科技工具,現已被廣泛應用于高頻量價的因子挖掘。雖然 AI 在機器學習、深度學習、大數據處理等方面能提供超越人類思維的算法邏輯,為策略研發提供更多可能,但在當前市場 AI 更多是一種輔助工具,能發揮多少還得看管理人的水平。
特别是一些低頻量化、具有獨特數據處理邏輯與算法的私募對 AI 的依賴性并沒有那麼強,這樣的團隊市場上仍是主流,其中不乏業績持續穩定的管理人。
既然時下大模型對量化投資幫助有限,量化私募距離做大模型還很遠。那量化集體布局 AI 實驗室的目的是什麼 ? 僅僅是看好量化未來的火拼,取決于各家 AI 實力?
DeepSeek 對量化意味着什麼?
在非量化金融人士眼裏,國内量化做出 DeepSeek 似乎有其必然性。
因為 DeepSeek 降低訓練成本,原本就屬于量化的方法論,包括怎麼針對卡的集群做更精準的調校,如何用浮點的精度調整文字模型。再加上量化對卡的使用較早,運用娴熟,對集群的理解比别人更強,所以很多人認為量化做出 DeepSeek 是一件自然的事情。
但在很多量化老板眼裏,DeepSeek 是一個無法復制的行業個例。
一個直觀的對比:美國擁有 D.E.Shaw、Two Sigma 等遠比幻方體量、實力強得多的量化基金,同樣在 AI 領網域積澱深厚,更是沒有芯片制約,但做出世界級大模型的也不是他們。
在量化從業者們看來,DeepSeek 誕生在量化行業本就是一個奇迹,不僅重振了人們對中國科技與中國資產的信心,也間接地改善了量化的展業環境。
輿論壓力緩解的同時,量化的技術力量也引起了金融行業更廣泛的重視。近日,深圳私募基金業協會召開私募量化機構調研座談會,與 16 家頭部量化共同探讨「AI+ 資產管理」,并對設立「量化創新實驗室」推動產學研合作提供政策支持。
蒙玺投資辦公地在上海,AI 實驗室卻落地合肥。創始人李骧安徽人,畢業于中科大,當前是中科大金融碩士研究生指導老師。據遠川了解,蒙玺的目的不是追趕 DeepSeek,而是另辟蹊徑吸引中科大的優秀學生,也有一部分回饋母校的情懷。
「我們做 AI Lab 是為了給中科大學生提供一些 AI 相關的就業機會、實習機會。AI Lab 如果能做出一些用到實盤的東西就非常成功了,如果能在主流期刊發表論文那就極度成功了。」蒙玺認為即使實現這些成果,距離做大模型還是很遠。
另一方面,在大學邊駐點是量化搶人的一種方式。比如李骧的校友,寬德創始人馮鑫就在北京高校邊駐點時發現人大數學系 90 後天才少年徐御之,後者一路晉升為寬德合夥人并成為公司最大股東。相比之前,AI 實驗室總比量化炒股對頂級大學生更有吸引力。
過去,量化老板最大的困惑是找不到在中國商業社會的站位——除了為市場提供流動性,自身的價值意義在哪?如果作為一種普惠金融幫老百姓賺錢尚且算是一種意義,但私募百萬申購門檻顯然把這層意義擋在了門外。
直到 DeepSeek 的出現,為量化行業打樣了一個實現社會價值的路徑,量化老板的困惑也由此解開。某種程度上,量化私募集體設立 AI 實驗室不是為了造出下一個 DeepSeek,而是在一個 AI 正在從方方面面改變和重塑人們的工作和生活方式的時代裏,将溢出的技術通過逐漸普及的應用反哺給更多的普羅大眾。
參考資料
[ 1 ] 「3 萬張卡」、60 億投入後,DeepSeek 發了 5000 億紅包,騰訊科技
[ 2 ] 橋水 CEO:我們的人工智能基金堪比人類管理的基金,彭博商業周刊
[ 3 ] 中金 | 大模型系列(1):DeepSeek-R1 量化策略實測,中金點睛
封面來源:shotdeck
作者:沈晖
編輯:張婕妤