顶级量化公司如何用 AI 赢得每笔交易：完整路线图

大多数交易员听到"AI 交易"时想象的是一个吐出买入信号的聊天机器人。

世界顶级量化公司现在正在做的事情完全不同。他们正在做的与大多数系统交易员理解之间的差距，是现代市场中最大的未开发 edge 之一。

顶级公司的 AI 投入

Jane Street：2025 年承诺 60 亿美元投入 AI 云基础设施。在德州建造专用数据中心，容纳 4,032 块液冷 GPU，专门用于训练下一代交易模型。2025 年交易收入 396 亿美元，约 3,500 名员工。量化研究负责人 Craig Falls 公开表示依赖 CoreWeave 的 GPU 基础设施训练和扩展专有模型。

Man Group：全球最大上市对冲基金，管理约 1,500 亿美元。公开与 Anthropic 合作，使用 Claude 作为 alpha 生成 pipeline 的骨干。量化部门 Man Numeric 构建内部工具 AlphaGPT，自主生成、编码和回测交易策略。

Two Sigma：多年来在 700 亿美元资产上运行 AI 驱动策略。

Citadel：构建内部 AI 助手，扫描 transcript、总结券商研究、为股票团队 flag 风险。该工具现在是公司大多数股票投资者的日常工作流的一部分。

Bridgewater Associates：2023 年成立 Artificial Investment Associate Labs 部门。CEO Nir Bar Dea 在 2025 年 3 月 Bloomberg 会议上表示，其 20 亿美元 AI 基金产生"与人类所做不相关的独特 alpha"。AI 是基金的主要决策者，人类专业人士监督风险管理和交易执行。

这些不是实验。是运行真实资金的生产系统。

关键问题：取代还是加速？

顶级公司是用 AI 取代他们的量化分析师？还是用它让量化分析师快到其他人根本跟不上？

答案改变了一切关于你应该如何构建自己系统的方式。

每个公开谈论 AI 实施的公司都确认了相同的模式：

AI 处理速度和体量重要的部分：假设生成、代码编写、初始回测、数据处理。

人类处理判断重要的部分：regime 评估、资金配置、风险监督、条件变化时关闭系统的决策。

获胜的公司不是用 AI 取代量化分析师。他们让量化分析师 10 倍快。这是你应该复制的模型。

五个已确认的生产级用例

用例 1：Agentic Signal Discovery

Man Group 用 AlphaGPT 构建的架构。四个独立 agent 循环运行：

第一个从数据生成信号假设
第二个编写精确逻辑和实现代码
第三个纯粹作为挑战者，工作是找到信号可能是假的、过拟合的或经济上不合理的每一个理由
第四个评估回测并决定是否值得发送给人类审核

Man Group 自己的描述：系统行为很像真实的公司，一群团队。一个人提议。另一个人挑战。第三个人评估。agents 同时跑数百个 idea。通过对抗性审核的进入研究员。其余丢弃。

用例 2：替代数据信号提取

Point72 使用 NLP 模型分析 earnings call transcript，转换成直接输入期权策略的结构化信号。Two Sigma 用机器学习从卫星图像和宏观经济数据中提取信号。

对系统交易员来说，最立即可访问的版本是 earnings call 分析。Transcript 是公开的。

核心转变：非结构化信息被转换成精确的数值信号。Edge 来自 AI 同时处理每个 transcript、每个 filing、每片可用数据，产生一致的量化输出。

用例 3：AI 加速回测

系统研究中最大的瓶颈不是没想法。是有想法到知道它是否有真实历史有效性之间的时间。把那个周期减半的研究员每年测试两倍策略。五年后那个吞吐量差异是决定性的。

用例 4：蒙特卡洛显著性测试

每个标准回测使用历史的一条路径。一条路径不足以知道结果反映的是 genuine edge 还是测试窗口中特定事件序列。

蒙特卡洛模拟生成数千条可能路径，展示结果的完整分布：第五百分位结果、预期最大回撤、损失超过风险阈值的概率。这三个数字在投入任何资金之前决定仓位大小。

用例 5：Regime-Aware 仓位管理

Regime 模型告诉你市场在哪、 transitioning 的概率。AI 综合这个信号与当前回撤、实现波动率估计、信号强度，产生一个在所有输入上一致的仓位建议。

在低波动 trending regime 中正确的仓位，在高波动危机 regime 中几乎肯定太大。没有单一输入告诉你正确大小。四个的综合才做到。

六阶段 Pipeline

五个阶段自动化。一个阶段——人类判断门——永远人类。

数据摄入和特征工程：数据质量设定后续一切的天花板
信号假设生成：具体、可测试的假设，附带经济 rationale 和预期失效条件
对抗性挑战：大多数零售量化完全跳过的阶段，也是 AlphaGPT 与聊天机器人交易建议的分水岭
Walk Forward 回测：每个时间点，每个模型参数只用该点之前可用的历史数据估计
统计显著性测试：生成匹配统计属性的随机策略回报序列一千次。实际 Sharpe ratio sits 在 top 5% → genuine edge 的证据
人类审核门：此阶段不能自动化。Man Group、Bridgewater、Citadel、Jane Street 都公开确认了这一点

部署监控层

定义阈值，在开始交易之前。最糟糕的时刻做那个决定是系统已经 underperforming 的时候。

输出是 flag for human review，不是自动关闭。Markov Chain regime 信号作为额外 trigger 直接 feed 进这个监控层。

核心转变：从天数到小时数

AI 之前：想法来自读论文或观察市场异常。实现代码写几小时到几天。设置 proper 回测额外时间。任何研究员一年能认真测试的 idea 数量严重受限。Idea 选择发生在测试之前而不是因为测试。风险管理是单独的 manual 步骤。仓位管理靠直觉校准，回撤超预期后调整。

AI 之后：想法到严格评估的时间从几天压缩到几小时。测试快时，你可以测试感觉不太确定的 idea。可以在投入时间构建之前对自己的假设跑对抗性审核。可以生成十几个 promising 信号变体并全部互测，而不是靠直觉挑一个。

Man Group 精确描述：技术帮助他们测试更多 idea。送交研究员的质量门槛提高了，因为 AI 预过滤了常见失败模式。研究员花时间评估已经 survived 自动化挑战流程的信号，而不是把时间花在实现工作上。

结论

AI 不预测市场。它做的是把交易想法到对该想法的严格测试之间的时间从几天压缩到几小时。它跑大多数系统交易员从不应用于自己假设的对抗性审核。它把单个量化的研究吞吐量扩展到以前需要整个团队的水平。

Man Group 公开 AlphaGPT 后说：LLM 显著加速了变化 pace。但他们的量化分析师还在。每个触及资金的信号都有研究员签字。

Bridgewater 更进一步，构建 20 亿美元基金，AI 是主要决策者，人类监督风险和执行。

Jane Street 投资 60 亿美元 GPU 基础设施来乘以研究员能做的事，不是取代他们。

AI 给了他们规模。判断仍然是人类的。