从公式搜索(formula search)到自我改进的研究智能体(self-improving research agents)——一部自动化 alpha 发现(automated alpha discovery)的谱系,分八篇长文阅读。每个专题都附上原论文的架构图、可即时 渲染的核心公式,以及关键处的代码。脉络从遗传规划(genetic programming)与强化学习(reinforcement learning),经生成–预测(generative–predictive)挖掘与生成流网络(GFlowNet),到新一代 LLM 研究 循环——并在最后落到文献普遍忽略的方法论脊柱,再给出"循环下一步该优化什么"的提案与一个实盘案例。
“围绕智能体(agents)的热度甚至超出了我的预期。循环(loops)是下一步——三到六个月内,每个人都会 运行自我改进的循环。不再需要提示词(prompting)。” — 转述 Andrew Ng 关于智能体工作流的论述(2026)
闭合"假设→实现→回测→反馈"循环:因子–模型联合优化(NeurIPS 2025)与抗衰减挖掘(KDD 2025)。
行业专家混合(Mixture of Sector Experts):把研讨班方法用到一个实盘模型上。AlphaForge 作为动态组合器(而非生成器)、改造后的数学,以及过拟合究竟在哪、又不在哪。