量化卷大模型，还有意义吗？

今天小编分享的财经经验：量化卷大模型，还有意义吗？，欢迎阅读。

风评转向很快，量化从股市敌对势力到掀起科技国运，仅用了一年时间。

DeepSeek R1 的开源，几乎拉齐了中美大模型的代差，也重塑了量化行业的公众形象。对于过去两年深陷某种道德困境的量化私募行业而言，AI 实验室成为了当下一个不可忽视的风口。在巨大的社会价值面前，扩招的消息一个接着一个。

宽德 Will Lab 招募 AI 工程师，鸣石创世纪 AI Lab 招募 AI 科学家，蒙玺 AI Lab 招募机器学习实习生，黑翼、磐松、正定、启林、世纪前沿近期也加入 AI 抢人之争。

而头部量化之间，这场 AI 军备竞赛其实早已暗流涌动。

众所不周知的是，明汯已囤了数千张 GPU 卡，数万张 CPU 核，在金融数据的应用场景下 AI 算力可以达到 400P Flops；九坤更是与微软亚洲研究院复现了 DeepSeek R1 模型，在此之前低调建立了 Data Lab、AI Lab、水滴等多个 AI 实验室。

看起来 DeepSeek 已不仅是资本市场信心重启的重要催化剂，更变成了一些量化私募的 OKR，激励他们以更重要的角色参与到时代进程里。

只是在与多位量化管理人交流后，笔者感受到一种温差：如火如荼的投产之下，各大建立 AI 实验室的量化在大语言模型能力上距离 DeepSeek 还很远。反过来，DeepSeek 目前对量化投研的帮助也十分有限。

整个量化行业，集体投入到建设 AI 实验室的热情中，真实意图并不只是技术理想主义的追求。

量化难有下一个 DeepSeek

开年以来，机构尽调量化私募时会多问一句，「你们家有多少张卡？」

虽说算力储备难与投资能力扯上多少关系，但在很多尽调机构眼里，卡的数量一定程度反映了量化私募的做成大模型的概率，对于一些销售机构而言，这也是衡量量化私募未来的某种标尺。

但一个显而易见的现实是，大多数量化私募目前并没有足以支撑做大模型的算力。

大模型的算力门槛相当之高。幻方是全国为数不多万卡集群的公司，2021 年，幻方对「萤火 2 号」AI 集群投入 10 亿，搭载了 1 万张 A100 显卡。2024 年，DeepSeek V3 官方报告训练大模型使用了 2048 块 H800 GPU 集群。中存算董事长陈巍测算，幻方实际的卡数 2.78 万张（A100+H20）+2048 张 H800，大概在 3 万张左右的规模 [ 1 ] 。

多数量化私募并不具备如此阔绰的家底。

一名上海百亿量化管理人向远川透露：「当前购入大量先进显卡难度非常大，且成本高昂，建设大模型算力投入至少数十亿，这就要求量化每年至少有 10 亿利润。即便如此，人才成本、时间成本、团队磨合成本都不可忽略，未来几年基本不可能再出一个 DeepSeek，弯道超车难度巨大。」

另一名百亿量化老板告诉远川，目前在算力和利润上符合做大模型条件的另外两家量化，只有九坤和明汯，「九坤规模体量足够大，而且比较学院派，跟清华北大联系密切，有足够的人才供给。」但据远川了解，九坤与幻方的方向并不相同，相较基础模型，他们更关注垂網域模型并推动 AI 在应用领網域的落地。

「而明汯，我觉得搞大模型不像老裘的风格，老裘还是希望在金融领網域与国际顶级对冲基金竞争。」

简言之，量化做大模型最大的两个门槛是算力密度和人才密度，这两者与钞能力休戚相关。比如幻方没有融资的顾虑，拥有大部分量化以及大部分 AI 创业公司都难以企及的「造血能力」。

这种「造血能力」创造了松弛的研发环境，DeepSeek 160 人研发团队基本是没有海归背景和大厂背景的年轻人，BOSS 直聘上 DeepSeek 招募的深度学习研究员年收入高达 176 万，超越了降薪背景下很多公募投研。在优渥待遇的前提下，研发人员还能从容地获得源源不断的输血支撑算法行业的巨量失败。

超额衰减的当下，多数量化自身规模尚不算殷实，面临着未来更激烈的内卷，更没有在芯片出口管制之前低价囤上数万张卡，错过了财富积累的黄金时间。

就算具备一切现实要素，创始人没有利润之上的价值取向也很难维系持续的重金投入，就像朱啸虎溢于言表的赞美，「梁文锋的想法确实不一样，他连几个亿的用户都不要，任何考虑赚钱的角度都太世俗了。」

蒙玺投资告诉远川，量化做大模型的視窗期已经过去了。「做这个的价值在哪里？DeepSeek 是开源的，在他们的基础上改一改代码然后让大家眼前一亮，怎么可能？」

DeepSeek 对投资帮助有限

DeepSeek 横空出世以来，金融行业弥漫了一层焦虑，量化私募运用 DeepSeek 先进生产力，好比给本就强悍的策略增添了核动力。量化集体建设实验室加码 AI，也意味着仅剩不多的超额未来或许会被加速榨干。

倍漾量化 CEO 冯霁判断：「三年内不使用 AI 的量化基金势必遭淘汰。」在他看来，DeepSeek 是向那些仍然不相信 AI 力量的人，作最后一次的呼吁 [ 2 ] 。

除了互联网行业，资管行业数十家机构已争先恐后地「接入」DeepSeek。中金测试其量化选股能力，发现 2024 年以来 671b 标准版 DeepSeek-R1 在行业轮动上有稳定超额 [ 3 ] 。大模型极大提高量化中后台制作路演材料的速率，VS Code+Github Copilot 比炸鸡配啤酒还香。

虽然行业一片欢呼雀跃，但客观看 DeepSeek 在投研上的主要应用于两个维度，与其他大模型没有实质区别：

一是输入端拓宽另类数据获取方式。DeepSeek 能分析新闻研报文本、语音、视频多个另类数据源，有很强的信息处理能力，不仅能从新闻中获取情绪因子，对专家访谈的回答质量也能定性判断。

鸣熙资本基金经理陈昊炜，曾就职于美国对冲基金 Point 72。他想起一个有意思的细节，当上市公司高管回答投资者问题时，Point 72 创始人 Steve Cohen 喜欢聘请 FBI 的专家来对他们的微表情进行判断，观察他们表达是否自信，话语是否存在猫腻。诸如此类的细节，为美剧《亿万》打造主角提供了非常多的原型参考。

「具备多模态的能力的大语言模型能通过微表情变化进行情绪判断，把非结构化数据转变为结构化数据。」陈昊炜说。

二是输出端提高编程的效率。平方和投资对远川表示，最直观的变化是 DeepSeek 降低了投研人员在接触新的编程语言时的门槛，「VS Code 等编辑器也集成诸多 AI 插件，实现从代码静态分析到动态优化建议的全链路赋能，便于编程人员的代码分析、优化和管理。」

DeepSeek 是能够对代码层面的重构、金融语料的训练、另类数据的处理等投研流程提效增速，但百亿量化龙旗科技告诉远川，「至少目前而言，大模型处理的精细度还远远达不到我们的实际要求。」龙旗认为通过基本面研究，结合机器学习特别是深度学习来处理数据构建模型，对他们来讲比运用大模型更具实践意义。

蒙玺投资很早在本地部署 DeepSeek，最大的用处是辅助编程，「通俗来说就是找 BUG。」如果研究员 Prompt 写的足够好，还可给 DeepSeek 喂研报，让它自动去做因子。「不过在精细化层面，比如模型预测这块我们是不太可能让 DeepSeek 参与太多。」

对于绝大多数量化私募来说，DeepSeek 等大模型对量化投资的实盘帮助有限。

从过程来看，大模型在处理文本及其逻辑上优势明显，量化投研则是数据处理上有更大需求，舆情类因子占比不大；从结果来看，DeepSeek 有幻觉和生产内容随机性的局限，模型输出结果未必符合现在量化投研的严谨要求。

即使不聚焦 DeepSeek，AI 整体对量化也无法起到决定性作用。目前量化管理人的 AI 能力和基金的未来业绩并没有直接的正相关系，否则幻方就是业绩最好的量化的基金。

AI 作为一种科技工具，现已被广泛应用于高频量价的因子挖掘。虽然 AI 在机器学习、深度学习、大数据处理等方面能提供超越人类思维的算法逻辑，为策略研发提供更多可能，但在当前市场 AI 更多是一种辅助工具，能发挥多少还得看管理人的水平。

特别是一些低频量化、具有独特数据处理逻辑与算法的私募对 AI 的依赖性并没有那么强，这样的团队市场上仍是主流，其中不乏业绩持续稳定的管理人。

既然时下大模型对量化投资帮助有限，量化私募距离做大模型还很远。那量化集体布局 AI 实验室的目的是什么 ? 仅仅是看好量化未来的火拼，取决于各家 AI 实力？

DeepSeek 对量化意味着什么？

在非量化金融人士眼里，国内量化做出 DeepSeek 似乎有其必然性。

因为 DeepSeek 降低训练成本，原本就属于量化的方法论，包括怎么针对卡的集群做更精准的调校，如何用浮点的精度调整文字模型。再加上量化对卡的使用较早，运用娴熟，对集群的理解比别人更强，所以很多人认为量化做出 DeepSeek 是一件自然的事情。

但在很多量化老板眼里，DeepSeek 是一个无法复制的行业个例。

一个直观的对比：美国拥有 D.E.Shaw、Two Sigma 等远比幻方体量、实力强得多的量化基金，同样在 AI 领網域积淀深厚，更是没有芯片制约，但做出世界级大模型的也不是他们。

在量化从业者们看来，DeepSeek 诞生在量化行业本就是一个奇迹，不仅重振了人们对中国科技与中国资产的信心，也间接地改善了量化的展业环境。

舆论压力缓解的同时，量化的技术力量也引起了金融行业更广泛的重视。近日，深圳私募基金业协会召开私募量化机构调研座谈会，与 16 家头部量化共同探讨「AI+ 资产管理」，并对设立「量化创新实验室」推动产学研合作提供政策支持。

蒙玺投资办公地在上海，AI 实验室却落地合肥。创始人李骧安徽人，毕业于中科大，当前是中科大金融硕士研究生指导老师。据远川了解，蒙玺的目的不是追赶 DeepSeek，而是另辟蹊径吸引中科大的优秀学生，也有一部分回馈母校的情怀。

「我们做 AI Lab 是为了给中科大学生提供一些 AI 相关的就业机会、实习机会。AI Lab 如果能做出一些用到实盘的东西就非常成功了，如果能在主流期刊发表论文那就极度成功了。」蒙玺认为即使实现这些成果，距离做大模型还是很远。

另一方面，在大学边驻点是量化抢人的一种方式。比如李骧的校友，宽德创始人冯鑫就在北京高校边驻点时发现人大数学系 90 后天才少年徐御之，后者一路晋升为宽德合伙人并成为公司最大股东。相比之前，AI 实验室总比量化炒股对顶级大学生更有吸引力。

过去，量化老板最大的困惑是找不到在中国商业社会的站位——除了为市场提供流动性，自身的价值意义在哪？如果作为一种普惠金融帮老百姓赚钱尚且算是一种意义，但私募百万申购门槛显然把这层意义挡在了门外。

直到 DeepSeek 的出现，为量化行业打样了一个实现社会价值的路径，量化老板的困惑也由此解开。某种程度上，量化私募集体设立 AI 实验室不是为了造出下一个 DeepSeek，而是在一个 AI 正在从方方面面改变和重塑人们的工作和生活方式的时代里，将溢出的技术通过逐渐普及的应用反哺给更多的普罗大众。