今天小编分享的财经经验:量化卷大模型,还有意义吗?,欢迎阅读。
风评转向很快,量化从股市敌对势力到掀起科技国运,仅用了一年时间。
DeepSeek R1 的开源,几乎拉齐了中美大模型的代差,也重塑了量化行业的公众形象。对于过去两年深陷某种道德困境的量化私募行业而言,AI 实验室成为了当下一个不可忽视的风口。在巨大的社会价值面前,扩招的消息一个接着一个。
宽德 Will Lab 招募 AI 工程师,鸣石创世纪 AI Lab 招募 AI 科学家,蒙玺 AI Lab 招募机器学习实习生,黑翼、磐松、正定、启林、世纪前沿近期也加入 AI 抢人之争。
而头部量化之间,这场 AI 军备竞赛其实早已暗流涌动。
众所不周知的是,明汯已囤了数千张 GPU 卡,数万张 CPU 核,在金融数据的应用场景下 AI 算力可以达到 400P Flops;九坤更是与微软亚洲研究院复现了 DeepSeek R1 模型,在此之前低调建立了 Data Lab、AI Lab、水滴等多个 AI 实验室。
看起来 DeepSeek 已不仅是资本市场信心重启的重要催化剂,更变成了一些量化私募的 OKR,激励他们以更重要的角色参与到时代进程里。
只是在与多位量化管理人交流后,笔者感受到一种温差:如火如荼的投产之下,各大建立 AI 实验室的量化在大语言模型能力上距离 DeepSeek 还很远。反过来,DeepSeek 目前对量化投研的帮助也十分有限。
整个量化行业,集体投入到建设 AI 实验室的热情中,真实意图并不只是技术理想主义的追求。
量化难有下一个 DeepSeek
开年以来,机构尽调量化私募时会多问一句,「你们家有多少张卡?」
虽说算力储备难与投资能力扯上多少关系,但在很多尽调机构眼里,卡的数量一定程度反映了量化私募的做成大模型的概率,对于一些销售机构而言,这也是衡量量化私募未来的某种标尺。
但一个显而易见的现实是,大多数量化私募目前并没有足以支撑做大模型的算力。
大模型的算力门槛相当之高。幻方是全国为数不多万卡集群的公司,2021 年,幻方对「萤火 2 号」AI 集群投入 10 亿,搭载了 1 万张 A100 显卡。2024 年,DeepSeek V3 官方报告训练大模型使用了 2048 块 H800 GPU 集群。中存算董事长陈巍测算,幻方实际的卡数 2.78 万张(A100+H20)+2048 张 H800,大概在 3 万张左右的规模 [ 1 ] 。
多数量化私募并不具备如此阔绰的家底。
一名上海百亿量化管理人向远川透露:「当前购入大量先进显卡难度非常大,且成本高昂,建设大模型算力投入至少数十亿,这就要求量化每年至少有 10 亿利润。即便如此,人才成本、时间成本、团队磨合成本都不可忽略,未来几年基本不可能再出一个 DeepSeek,弯道超车难度巨大。」
另一名百亿量化老板告诉远川,目前在算力和利润上符合做大模型条件的另外两家量化,只有九坤和明汯,「九坤规模体量足够大,而且比较学院派,跟清华北大联系密切,有足够的人才供给。」但据远川了解,九坤与幻方的方向并不相同,相较基础模型,他们更关注垂網域模型并推动 AI 在应用领網域的落地。
「而明汯,我觉得搞大模型不像老裘的风格,老裘还是希望在金融领網域与国际顶级对冲基金竞争。」
简言之,量化做大模型最大的两个门槛是算力密度和人才密度,这两者与钞能力休戚相关。比如幻方没有融资的顾虑,拥有大部分量化以及大部分 AI 创业公司都难以企及的「造血能力」。
这种「造血能力」创造了松弛的研发环境,DeepSeek 160 人研发团队基本是没有海归背景和大厂背景的年轻人,BOSS 直聘上 DeepSeek 招募的深度学习研究员年收入高达 176 万,超越了降薪背景下很多公募投研。在优渥待遇的前提下,研发人员还能从容地获得源源不断的输血支撑算法行业的巨量失败。
超额衰减的当下,多数量化自身规模尚不算殷实,面临着未来更激烈的内卷,更没有在芯片出口管制之前低价囤上数万张卡,错过了财富积累的黄金时间。
就算具备一切现实要素,创始人没有利润之上的价值取向也很难维系持续的重金投入,就像朱啸虎溢于言表的赞美,「梁文锋的想法确实不一样,他连几个亿的用户都不要,任何考虑赚钱的角度都太世俗了。」
蒙玺投资告诉远川,量化做大模型的視窗期已经过去了。「做这个的价值在哪里?DeepSeek 是开源的,在他们的基础上改一改代码然后让大家眼前一亮,怎么可能?」
DeepSeek 对投资帮助有限
DeepSeek 横空出世以来,金融行业弥漫了一层焦虑,量化私募运用 DeepSeek 先进生产力,好比给本就强悍的策略增添了核动力。量化集体建设实验室加码 AI,也意味着仅剩不多的超额未来或许会被加速榨干。
倍漾量化 CEO 冯霁判断:「三年内不使用 AI 的量化基金势必遭淘汰。」在他看来,DeepSeek 是向那些仍然不相信 AI 力量的人,作最后一次的呼吁 [ 2 ] 。
除了互联网行业,资管行业数十家机构已争先恐后地「接入」DeepSeek。中金测试其量化选股能力,发现 2024 年以来 671b 标准版 DeepSeek-R1 在行业轮动上有稳定超额 [ 3 ] 。大模型极大提高量化中后台制作路演材料的速率,VS Code+Github Copilot 比炸鸡配啤酒还香。
虽然行业一片欢呼雀跃,但客观看 DeepSeek 在投研上的主要应用于两个维度,与其他大模型没有实质区别:
一是输入端拓宽另类数据获取方式。DeepSeek 能分析新闻研报文本、语音、视频多个另类数据源,有很强的信息处理能力,不仅能从新闻中获取情绪因子,对专家访谈的回答质量也能定性判断。
鸣熙资本基金经理陈昊炜,曾就职于美国对冲基金 Point 72。他想起一个有意思的细节,当上市公司高管回答投资者问题时,Point 72 创始人 Steve Cohen 喜欢聘请 FBI 的专家来对他们的微表情进行判断,观察他们表达是否自信,话语是否存在猫腻。诸如此类的细节,为美剧《亿万》打造主角提供了非常多的原型参考。
「具备多模态的能力的大语言模型能通过微表情变化进行情绪判断,把非结构化数据转变为结构化数据。」陈昊炜说。
二是输出端提高编程的效率。平方和投资对远川表示,最直观的变化是 DeepSeek 降低了投研人员在接触新的编程语言时的门槛,「VS Code 等编辑器也集成诸多 AI 插件,实现从代码静态分析到动态优化建议的全链路赋能,便于编程人员的代码分析、优化和管理。」
DeepSeek 是能够对代码层面的重构、金融语料的训练、另类数据的处理等投研流程提效增速,但百亿量化龙旗科技告诉远川,「至少目前而言,大模型处理的精细度还远远达不到我们的实际要求。」龙旗认为通过基本面研究,结合机器学习特别是深度学习来处理数据构建模型,对他们来讲比运用大模型更具实践意义。
蒙玺投资很早在本地部署 DeepSeek,最大的用处是辅助编程,「通俗来说就是找 BUG。」如果研究员 Prompt 写的足够好,还可给 DeepSeek 喂研报,让它自动去做因子。「不过在精细化层面,比如模型预测这块我们是不太可能让 DeepSeek 参与太多。」
对于绝大多数量化私募来说,DeepSeek 等大模型对量化投资的实盘帮助有限。
从过程来看,大模型在处理文本及其逻辑上优势明显,量化投研则是数据处理上有更大需求,舆情类因子占比不大;从结果来看,DeepSeek 有幻觉和生产内容随机性的局限,模型输出结果未必符合现在量化投研的严谨要求。
即使不聚焦 DeepSeek,AI 整体对量化也无法起到决定性作用。目前量化管理人的 AI 能力和基金的未来业绩并没有直接的正相关系,否则幻方就是业绩最好的量化的基金。
AI 作为一种科技工具,现已被广泛应用于高频量价的因子挖掘。虽然 AI 在机器学习、深度学习、大数据处理等方面能提供超越人类思维的算法逻辑,为策略研发提供更多可能,但在当前市场 AI 更多是一种辅助工具,能发挥多少还得看管理人的水平。
特别是一些低频量化、具有独特数据处理逻辑与算法的私募对 AI 的依赖性并没有那么强,这样的团队市场上仍是主流,其中不乏业绩持续稳定的管理人。
既然时下大模型对量化投资帮助有限,量化私募距离做大模型还很远。那量化集体布局 AI 实验室的目的是什么 ? 仅仅是看好量化未来的火拼,取决于各家 AI 实力?
DeepSeek 对量化意味着什么?
在非量化金融人士眼里,国内量化做出 DeepSeek 似乎有其必然性。
因为 DeepSeek 降低训练成本,原本就属于量化的方法论,包括怎么针对卡的集群做更精准的调校,如何用浮点的精度调整文字模型。再加上量化对卡的使用较早,运用娴熟,对集群的理解比别人更强,所以很多人认为量化做出 DeepSeek 是一件自然的事情。
但在很多量化老板眼里,DeepSeek 是一个无法复制的行业个例。
一个直观的对比:美国拥有 D.E.Shaw、Two Sigma 等远比幻方体量、实力强得多的量化基金,同样在 AI 领網域积淀深厚,更是没有芯片制约,但做出世界级大模型的也不是他们。
在量化从业者们看来,DeepSeek 诞生在量化行业本就是一个奇迹,不仅重振了人们对中国科技与中国资产的信心,也间接地改善了量化的展业环境。
舆论压力缓解的同时,量化的技术力量也引起了金融行业更广泛的重视。近日,深圳私募基金业协会召开私募量化机构调研座谈会,与 16 家头部量化共同探讨「AI+ 资产管理」,并对设立「量化创新实验室」推动产学研合作提供政策支持。
蒙玺投资办公地在上海,AI 实验室却落地合肥。创始人李骧安徽人,毕业于中科大,当前是中科大金融硕士研究生指导老师。据远川了解,蒙玺的目的不是追赶 DeepSeek,而是另辟蹊径吸引中科大的优秀学生,也有一部分回馈母校的情怀。
「我们做 AI Lab 是为了给中科大学生提供一些 AI 相关的就业机会、实习机会。AI Lab 如果能做出一些用到实盘的东西就非常成功了,如果能在主流期刊发表论文那就极度成功了。」蒙玺认为即使实现这些成果,距离做大模型还是很远。
另一方面,在大学边驻点是量化抢人的一种方式。比如李骧的校友,宽德创始人冯鑫就在北京高校边驻点时发现人大数学系 90 后天才少年徐御之,后者一路晋升为宽德合伙人并成为公司最大股东。相比之前,AI 实验室总比量化炒股对顶级大学生更有吸引力。
过去,量化老板最大的困惑是找不到在中国商业社会的站位——除了为市场提供流动性,自身的价值意义在哪?如果作为一种普惠金融帮老百姓赚钱尚且算是一种意义,但私募百万申购门槛显然把这层意义挡在了门外。
直到 DeepSeek 的出现,为量化行业打样了一个实现社会价值的路径,量化老板的困惑也由此解开。某种程度上,量化私募集体设立 AI 实验室不是为了造出下一个 DeepSeek,而是在一个 AI 正在从方方面面改变和重塑人们的工作和生活方式的时代里,将溢出的技术通过逐渐普及的应用反哺给更多的普罗大众。
参考资料
[ 1 ] 「3 万张卡」、60 亿投入后,DeepSeek 发了 5000 亿红包,腾讯科技
[ 2 ] 桥水 CEO:我们的人工智能基金堪比人类管理的基金,彭博商业周刊
[ 3 ] 中金 | 大模型系列(1):DeepSeek-R1 量化策略实测,中金点睛
封面来源:shotdeck
作者:沈晖
编辑:张婕妤