Alpha Agent

投资与风险管理（Investment & Risk Management）· 研究研讨班

从公式搜索（formula search）到自我改进的研究智能体（self-improving research agents）——一部自动化 alpha 发现（automated alpha discovery）的谱系，分八篇长文阅读。每个专题都附上原论文的架构图、可即时渲染的核心公式，以及关键处的代码。脉络从遗传规划（genetic programming）与强化学习（reinforcement learning），经生成–预测（generative–predictive）挖掘与生成流网络（GFlowNet），到新一代 LLM 研究循环——并在最后落到文献普遍忽略的方法论脊柱，再给出"循环下一步该优化什么"的提案与一个实盘案例。

“围绕智能体（agents）的热度甚至超出了我的预期。循环（loops）是下一步——三到六个月内，每个人都会运行自我改进的循环。不再需要提示词（prompting）。” — 转述 Andrew Ng 关于智能体工作流的论述（2026）

概览 — 从提示词到循环（From Prompting to Loops）

主旨，以及整个领域所处的两条轴线：公式搜索 vs. 任务搜索；横截面 IC vs. 条件事件概率。

约 25 分钟 · 立论

Read →

公式搜索时代 — AlphaEvolve 与 AlphaGen

基于表达式树的遗传规划（SIGMOD 2021），随后是以协同组合为奖励的 RL/PPO（KDD 2023）。

约 35 分钟 · GP · RL

Read →

AlphaForge — 生成–预测挖掘 + 动态组合

由代理模型评分的生成器、一个多样性损失，以及每日 OLS 的动态组合器——外加对官方代码库的拆解。

约 45 分钟 · AAAI 2025 · 代码