要点小结

面向经管学生、研究者与从业者的 AI 智能体设计教材

作者

李学恒、林建浩、严翊歆

发布于

2026-05-11

八阶段流水线加四件套的整体地图,在各节里已被逐块走过:规则基座(21.2)、数据管线(21.3)、因果识别与估计(21.4)、稳健性与产出自动化(21.5)、学术诚信与复现合规(21.6)、端到端案例(21.7)。这一节把这些组件拼回到一个端到端的视图里,让读者带着完整的项目骨架离开本章。

本章把经济学实证研究的八阶段工作流——从研究问题与识别假设到复现包组织——落到 Claude Code 的四件套上:CLAUDE.md 提供规则基座,Skills 承载可复用的能力单元,子代理负责任务分工,Hooks 把关键节点变成强制 HITL 检查点。末节的最低工资 DID 案例把这四件套串成一条可跑闭环,读者拿到项目骨架就能迁移到自己的研究问题。

核心组件汇总

本章在最低工资 DID 案例中完整用到的组件如下。

组件 数量 职责 对应章节
CLAUDE.md 1 路径规范、版本锁定、随机种子、变量命名、聚类约定、许可声明、AI 披露 21.2、21.7
.claude/rules/ 规则文件 3 data-processing.md 规定清洗准则;regression-spec.md 规定固定效应与聚类默认;output-format.md 规定表图格式 21.2
Skills 4 did-estimate 跑主回归(完整展示);另有 data-cleanrobustnessreplication-pack 三个 Skill 分别负责面板构建、稳健性矩阵和 AEA 复现包 21.3、21.4、21.5、21.7
子代理 3 reviewer-agent 做对抗式核查(完整展示);另有 dataprep-agent 做数据、estimator-agent 跑回归 21.5、21.7
Hooks 3 类 PreToolUse (Write) 拦截未含 set seed 的 do 文件;PostToolUse (Edit/Write) 扫描 vce() 是否声明;Stop 在主回归完成后强制审阅 21.5、21.6

这些组件不是孤立存在的。CLAUDE.md 为 Skills 提供默认参数,Skills 被子代理调用,子代理在 Hooks 监听下工作,整条链路由研究者在关键节点的判断串起来。

从研究问题到复现包的闭环

整个工作流的各节点与智能体归属如下。标注 HITL 的节点必须由研究者亲自判断,不由任何子代理替代。

flowchart LR
    A[研究问题<br>HITL] --> B[数据拉取<br>dataprep-agent]
    B --> C[清洗建面板<br>data-clean Skill]
    C --> D[样本规则<br>HITL]
    D --> E[主回归<br>did-estimate Skill]
    E --> F[规范确认<br>HITL]
    F --> G[稳健性矩阵<br>robustness Skill]
    G --> H[审阅<br>reviewer-agent]
    H --> I[结论措辞<br>HITL]
    I --> J[复现包<br>replication-pack Skill]

flowchart LR
    A[研究问题<br>HITL] --> B[数据拉取<br>dataprep-agent]
    B --> C[清洗建面板<br>data-clean Skill]
    C --> D[样本规则<br>HITL]
    D --> E[主回归<br>did-estimate Skill]
    E --> F[规范确认<br>HITL]
    F --> G[稳健性矩阵<br>robustness Skill]
    G --> H[审阅<br>reviewer-agent]
    H --> I[结论措辞<br>HITL]
    I --> J[复现包<br>replication-pack Skill]

整条链路由五个 HITL 节点切分为六段自动化子任务。研究者判断完识别假设,数据拉取和清洗自动执行;研究者确认完样本规则,主回归自动运行;研究者确认完主回归规范,稳健性矩阵自动展开;审阅子代理给出报告,研究者判断结论措辞;最后复现包自动打包。

用户只做两件事

这一整条链路里,研究者亲手做的事实际上只有两件:研究设计(识别策略、样本边界、稳健性矩阵维度的选择)和结论解读(系数是否符合经济逻辑、稳健性是否足以支撑论点、最终论文怎么写)。夹在这两端之间的数据清洗、脚本编写、表格排版、稳健性矩阵执行、格式核查,全部自动化。

这个分工的核心价值是把研究者从机械执行里解放出来。过去一个博士生可能花一整周去配齐 36 格稳健性矩阵,现在 40 分钟就能跑完,节省出的时间用在判断”哪些稳健性检验真正回应审稿人关切”这件更重要的事上。AI 不是在替代研究者,而是让研究者的判断力覆盖更大的工作量。

迁移到其他子领域

本章的案例以劳动经济学为场景,但整个四件套框架不局限于 DID。四个主要经济学子领域的迁移对照如下。

子领域 典型方法 迁移差异
金融实证 事件研究法 (Event Study) did-estimate 换为 event-study Skill,以 eventstudy2did_imputation 为底层命令;CLAUDE.md 加入 CRSP/Compustat 的本地化路径规范
发展经济学 RCT / IV Skill 拆分为 balance-check(处理与控制组平衡)+ iv-estimate(首阶段 F 统计量 + Hansen J 检验);子代理需要覆盖弱工具变量诊断
公共经济学 财政转移 RDD Skill 以 rdrobust 为核心,加入 bandwidth-choice 子 Skill 让 AI 跑 CCT 最优带宽并输出敏感性曲线;HITL 节点多一个”带宽选择是否合理”的检查
环境经济学 排放 IV / 合成控制 稳健性矩阵维度变为”工具变量集 × 样本 × 估计量”;sdid 常作为主回归之一,不只做稳健性;数据许可风险较高(EPA 微观数据)

迁移时只需替换三个位置:CLAUDE.md 的变量命名约定与许可声明、Skills 中的具体 Stata 命令、稳健性矩阵的维度定义。dataprep-agent / estimator-agent / reviewer-agent 三个子代理的分工逻辑几乎不用改。

本章核心信念

AI 把研究者从机械执行里解放出来,让判断力得以专注在真正难的问题上——识别策略是否站得住、样本边界是否合理、结论在哪些维度上稳健。Skills 可以跑遍矩阵,子代理可以核查格式,Hooks 可以拦截遗漏,但”研究问题是否值得做”、“结论是否可信”这两个最上游和最下游的判断,永远留给人。