自进化Agent突破量化因子挖掘瓶颈：QuantaAlpha框架实现27.75%年化收益

上财团队投稿

量子位 | 公众号 QbitAI

在量化金融的底层，Alpha因子本质上是一段可执行的代码逻辑，它们试图将嘈杂的市场数据映射为精准的交易信号。然而，长期以来，自动化因子挖掘始终被困在“两难”的夹缝中：传统的遗传规划 （Genetic Programming，GP） 虽然擅长在海量空间中进行进化搜索，但其本质是“盲目的随机变异”。

它们在回测中过度拟合了历史噪声，却在逻辑上极难解释，如同一个充满巧合的黑盒。而新兴的大语言模型 （LLM） 虽然具备强大的语义理解能力，能像人类一样读懂金融理论，但在处理高精度的量化逻辑时，却容易陷入“语义漂移”与“幻觉”。生成的代码往往语法完美，但在经济学逻辑上支离破碎，甚至不仅无法复现，更难以在实盘中生存。

这引发了一个根本性的思考：我们能否构建一个智能体，既拥有机器般不知疲倦的进化探索能力，又具备人类程序员般严谨的逻辑控制力？

正是在这一背景下，QuantaAlpha团队联合上海财经大学AIFin Lab等机构，提出了 QuantaAlpha 框架：一种全新的自进化Agent Alpha因子挖掘框架。

核心框架解析：基于轨迹的自进化范式

QuantaAlpha的核心创新在于将挖掘过程视为一条完整的轨迹 （Trajectory） ：

轨迹级进化：它不满足于单次的成功，而是追求轨迹级的进化；
定向搜索：它不依赖盲目的随机搜索，而是通过变异 （Mutation） 修正逻辑漏洞，通过交叉 （Crossover） 继承有效结构；
逻辑约束：它引入了严格的语义与复杂度约束，确保进化出的不仅是高收益代码，更是逻辑自洽的经济学假设。

当市场环境发生剧烈切换 （如2023年的A股小微盘崩塌） ，QuantaAlpha展现出了惊人的韧性。这不仅仅是一个工具的升级，而是向Agentic Science迈出的重要一步：让AI在充满噪声的真实金融市场中，实现真正的自我适应与生存。

自进化Agent突破量化因子挖掘瓶颈：QuantaAlpha框架实现27.75%年化收益

1. 多样化规划初始化（Diversified Planning Initialization）

在真实研究中，因子拥挤往往并非发生在后期筛选，而是在研究起点就已埋下。为此，QuantaAlpha在初始化阶段即显式引入多样化规划机制，而非依赖单一或少量种子因子。

具体而言，初始化Agent通过planning算子，同时生成多个彼此差异显著的研究方向，并将其分别展开为独立轨迹。例如，系统可以并行启动针对“短期微观结构动量”与“长周期基本面异象”的不同假设路径。这种设计并非追求覆盖更多因子形式，而是在搜索早期即拉开结构差异度，为后续进化过程提供足够的探索空间，从源头上缓解因子同质化与局部最优问题。

2. 轨迹变异（Mutation）

在非平稳市场中，研究失败往往并非“整体无效”，而是某一关键机制在当前环境下失灵。QuantaAlpha的变异算子正是围绕这一观察展开，其目标并不是随机扰动，而是有针对性地修正失效决策。

逻辑层面：系统通过自我反思模块，对低收益轨迹进行诊断，定位出导致性能下降的关键决策节点，例如假设层面的机制选择或因子结构中的核心算子。
操作层面：变异仅作用于被判定为失效的局部片段 （Refine） ，而对轨迹中已被验证有效的其余部分进行“冻结”。这种局部重构机制，使得搜索过程既能跳出原有假设，又避免了因全盘推翻而导致的逻辑不稳定。

通过轨迹级变异，系统能够在保留历史有效经验的同时，持续探索新的机制空间。

3. 轨迹交叉（Crossover）

如果说变异解决的是“如何修正错误方向”，那么交叉算子关注的则是如何复用成功经验。在QuantaAlpha中，交叉操作并非简单拼接表达式，而是发生在轨迹层面：系统会识别不同轨迹中表现稳定、逻辑互补的高价值片段，并将其重组为新的研究路径。

案例解析：在论文所展示的进化过程中，Agent将一个捕捉散户羊群效应 （Retail Herding） 的逆向因子，与另一个刻画机构动能 （Institutional Momentum） 的顺向因子进行交叉。
进化结果：最终生成的因子Institutional Momentum Score 20D，成功融合了两类机制：在趋势稳定阶段跟随机构协同交易，在极端波动环境中识别散户情绪修复，从而实现了逻辑层面的非线性整合。

这种交叉机制，使得有效研究结构得以跨轨迹继承，而非在每轮搜索中被反复“重新发现”。

4. 结构化约束（Structured Constraint）

LLM在因子挖掘中的一个核心风险，是语义漂移：生成的代码在形式上可执行，但已偏离最初的经济假设。QuantaAlpha通过引入多层结构化约束，对这一问题进行系统性约束。

1) 中间符号表示（AST）
因子必须以抽象语法树形式存在，所有算子 （如TS CORR、RANK） 均来自预定义算子库，确保其数学含义与金融语义的明确性。

2) 语义一致性验证（Consistency Verifier）
系统强制校验“投资假设—语言描述—符号表达—可执行代码”之间的一致映射关系。一旦发现实现试图通过“蹭指标”偏离原始逻辑，将被自动拦截并触发重写。

3) 复杂度与冗余过滤（Complexity and Redundancy Filtering）
通过符号长度约束与AST相似度匹配，系统拒绝过度复杂或与既有因子高度冗余的候选项，确保最终因子池具备持续的信息增量。

案例复盘：一个因子的进化史

QuantaAlpha是如何“思考”并进化的？我们通过一个具体的因子进化案例来观察其微观运作。

自进化Agent突破量化因子挖掘瓶颈：QuantaAlpha框架实现27.75%年化收益

Iteration 1：多样化初始化（Initialization）

系统最初生成的方向是基于微观结构的反转逻辑。产生的因子名为RegimeFiltered Reversal 5D。

逻辑：认为“高成交量且高波动率”代表噪声环境，通过波动率比值过滤，捕捉60日内的反转信号。
回测表现：ARR为5.22%，虽有初步效能，但夏普比率较低，抗回撤能力差。

Iteration 2：机制变异（Mutation）

在检测到反转逻辑的瓶颈后，系统触发了机制变异。它将目光从“反转”转向了“多尺度动量对齐”，生成了因子Nested Momentum Alignment 1 5 20。

逻辑：认为1日、5日、20日动量的共振对齐能预示趋势的持续，并加入了相关性加权。
效果：回测ARR提升至7.06%，成功从一个完全不同的维度寻找到了Alpha来源。

Iteration 5：逻辑重组（Crossover）

这是最关键的一步。系统将上一阶段的“动量对齐”逻辑与另一个专注于“散户参与度 （Retail Herding） ”的轨迹进行了交叉。最终诞生了强力因子：Institutional Momentum Score 20D （机构动量得分因子） 。

因子表达式：
RANK(TS CORR(DELTA(close, 1)/close, DELTA(volume, 1)/volume, 20) * TS MEAN((close-open)/close, 5))
逻辑解析：
该因子巧妙结合了两者的核心优势——左侧通过“量价相关性”捕捉机构协同交易信号 （Institutional Momentum） ，右侧通过“日内收益结构”捕捉零售情绪的反转窗口，并辅以波动率加权。
最终回测：
该因子不仅提升了预测准确度，更在复杂多变的市场中展现了极强的防御能力，成为最终因子池的核心成分。

实证表现：跨越市场周期的“生存耐力”

回测分析采用QLib框架对沪深300指数、沪深500指数和标普500指数进行，具体数据划分详见表1。因子构建采用六大基础特征——开盘价、高点、低点、收盘价、成交量和波动率 （Vwap） 。

为确保模型对异常值的鲁棒性，预处理流程包含：对缺失值进行前向填补、替换无限值、剔除标签缺失样本，以及对特征和标签同时应用横截面秩归一化 （CSRankNorm） 处理。

自进化Agent突破量化因子挖掘瓶颈：QuantaAlpha框架实现27.75%年化收益

1. 巅峰性能指标（基于GPT-5.2）

预测效能： 信息系数 （IC） 达到 0.1501，RankIC 达到 0.1465。

策略回报： 年化超额收益 （ARR） 高达 27.75%，最大回撤 （MDD） 仅为 7.98%，卡玛比率 （CR） 达到 3.4774。

自进化Agent突破量化因子挖掘瓶颈：QuantaAlpha框架实现27.75%年化收益

2. 零样本迁移

最强有力的证据来自于 分布外（OOD）迁移测试。在 CSI 300 上挖掘出的因子，直接迁移至 中证500 和 标普500，四年内分别创造了 160% 和 137% 的累积超额收益，证明了其捕获的是跨越国界与市值的通用市场逻辑。

自进化Agent突破量化因子挖掘瓶颈：QuantaAlpha框架实现27.75%年化收益

3. 韧性考验

2023年A股经历了从小市值风格到主题切换的剧烈波动，多数基于传统量价逻辑的因子 （如Alpha158库） 出现了严重的性能坍塌。

对比实证 （见图3）：相比于 AlphaAgent 和 RD-Agent 在 2023 年的 IC 值大幅回落，QuantaAlpha 通过挖掘“隔夜与拍卖信息 （Overnight Information）”等微观结构因子，维持了极高的信号强度。

明星因子示例：如 GapZ10 Overnight vs TR （Rank IC达0.0793），该因子通过捕捉隔夜跳空与真实波幅的关系，精准识别了市场在风格切换期间的非理性波动。

自进化Agent突破量化因子挖掘瓶颈：QuantaAlpha框架实现27.75%年化收益

结语：探索AI量化的系统化路径

QuantaAlpha 的价值，并不仅在于提供了一套自动化的因子挖掘工具，更在于提出了一种 LLM 与金融研究方法深度融合的可行路径。在高噪声、强非平稳的市场环境中，单纯依赖大模型进行端到端生成，往往难以保证研究逻辑的可控性与结果的可复用性。

通过引入轨迹级进化、显式语义约束以及复杂度与冗余控制，QuantaAlpha 将因子生成过程从一次性的“生成—筛选”，转化为一个 可追溯、可修正、可积累经验的研究流程。这种设计并非追求更激进的搜索，而是强调在真实市场噪声下，对研究假设、实现路径与经验迁移的稳定约束。

从更长远的视角看，QuantaAlpha 关注的并不只是单个因子的收益表现，而是如何构建一个能够在市场变化中持续学习、修正偏差、复用有效结构的智能研究体系。它展示了一种可能：当 LLM 不再只是“生成代码”，而是参与到假设形成、失败诊断与经验组合中，AI 才真正开始接近量化研究中长期积累价值的核心过程。

论文标题：QuantaAlpha: An Evolutionary Framework for LLM-Driven Alpha Mining
论文链接：https://arxiv.org/abs/2602.07085
开源代码：https://github.com/QuantaAlpha/QuantaAlpha

关于 QuantaAlpha
QuantaAlpha 成立于 2025 年 4 月，由来自清华、北大、中科院、CMU、港科大等院校的教授、博士后、博士与硕士组成。团队致力于探索智能的“量子”，引领智能体研究的“阿尔法”前沿，研究方向涵盖从 CodeAgent 到自进化智能，再到金融与跨领域专用智能体。

关于 AIFin Lab
AIFin Lab 由上财张立文教授发起，深耕 AI+金融/统计/数据科学交叉领域，团队汇聚上财、北大、复旦、东大、CMU、港中文等校前沿学者，打造数据、模型、评测、智能提示全链路体系。

自进化Agent突破量化因子挖掘瓶颈：QuantaAlpha框架实现27.75%年化收益

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/archives/21115

自进化Agent突破量化因子挖掘瓶颈：QuantaAlpha框架实现27.75%年化收益

上财团队 投稿

核心框架解析：基于轨迹的自进化范式

1. 多样化规划初始化（Diversified Planning Initialization）

2. 轨迹变异（Mutation）

3. 轨迹交叉（Crossover）

4. 结构化约束（Structured Constraint）

案例复盘：一个因子的进化史

Iteration 1：多样化初始化（Initialization）

Iteration 2：机制变异（Mutation）

Iteration 5：逻辑重组（Crossover）

实证表现：跨越市场周期的“生存耐力”

1. 巅峰性能指标（基于GPT-5.2）

2. 零样本迁移

3. 韧性考验

结语：探索AI量化的系统化路径

相关推荐

OpenClaw创始人揭秘：逆向API打造AI军团，80%手机App将被吞噬！

具身智能新纪元：LLMs与世界模型融合如何重塑物理世界交互

OpenAI前架构师深度剖析：AGI的关键在于模型自主突破能力，泛化问题成最大挑战

SceneMaker：突破3D生成瓶颈，从任意图像到完整3D场景的开放世界重建

北京版幻方开源SOTA代码大模型IQuest-Coder-V1：40B参数性能超Opus-4.5/GPT-5.2，单张3090可运行

上财团队投稿