八阶段流水线加四件套的整体地图,在各节里已被逐块走过:规则基座(21.2)、数据管线(21.3)、因果识别与估计(21.4)、稳健性与产出自动化(21.5)、学术诚信与复现合规(21.6)、端到端案例(21.7)。这一节把这些组件拼回到一个端到端的视图里,让读者带着完整的项目骨架离开本章。
本章把经济学实证研究的八阶段工作流——从研究问题与识别假设到复现包组织——落到 Claude Code 的四件套上:CLAUDE.md 提供规则基座,Skills 承载可复用的能力单元,子代理负责任务分工,Hooks 把关键节点变成强制 HITL 检查点。末节的最低工资 DID 案例把这四件套串成一条可跑闭环,读者拿到项目骨架就能迁移到自己的研究问题。
核心组件汇总
本章在最低工资 DID 案例中完整用到的组件如下。
CLAUDE.md
1
路径规范、版本锁定、随机种子、变量命名、聚类约定、许可声明、AI 披露
21.2、21.7
.claude/rules/ 规则文件
3
data-processing.md 规定清洗准则;regression-spec.md 规定固定效应与聚类默认;output-format.md 规定表图格式
21.2
Skills
4
did-estimate 跑主回归(完整展示);另有 data-clean、robustness、replication-pack 三个 Skill 分别负责面板构建、稳健性矩阵和 AEA 复现包
21.3、21.4、21.5、21.7
子代理
3
reviewer-agent 做对抗式核查(完整展示);另有 dataprep-agent 做数据、estimator-agent 跑回归
21.5、21.7
Hooks
3 类
PreToolUse (Write) 拦截未含 set seed 的 do 文件;PostToolUse (Edit/Write) 扫描 vce() 是否声明;Stop 在主回归完成后强制审阅
21.5、21.6
这些组件不是孤立存在的。CLAUDE.md 为 Skills 提供默认参数,Skills 被子代理调用,子代理在 Hooks 监听下工作,整条链路由研究者在关键节点的判断串起来。
从研究问题到复现包的闭环
整个工作流的各节点与智能体归属如下。标注 HITL 的节点必须由研究者亲自判断,不由任何子代理替代。
flowchart LR
A[研究问题<br>HITL] --> B[数据拉取<br>dataprep-agent]
B --> C[清洗建面板<br>data-clean Skill]
C --> D[样本规则<br>HITL]
D --> E[主回归<br>did-estimate Skill]
E --> F[规范确认<br>HITL]
F --> G[稳健性矩阵<br>robustness Skill]
G --> H[审阅<br>reviewer-agent]
H --> I[结论措辞<br>HITL]
I --> J[复现包<br>replication-pack Skill]
flowchart LR
A[研究问题<br>HITL] --> B[数据拉取<br>dataprep-agent]
B --> C[清洗建面板<br>data-clean Skill]
C --> D[样本规则<br>HITL]
D --> E[主回归<br>did-estimate Skill]
E --> F[规范确认<br>HITL]
F --> G[稳健性矩阵<br>robustness Skill]
G --> H[审阅<br>reviewer-agent]
H --> I[结论措辞<br>HITL]
I --> J[复现包<br>replication-pack Skill]
整条链路由五个 HITL 节点切分为六段自动化子任务。研究者判断完识别假设,数据拉取和清洗自动执行;研究者确认完样本规则,主回归自动运行;研究者确认完主回归规范,稳健性矩阵自动展开;审阅子代理给出报告,研究者判断结论措辞;最后复现包自动打包。
用户只做两件事
这一整条链路里,研究者亲手做的事实际上只有两件:研究设计 (识别策略、样本边界、稳健性矩阵维度的选择)和结论解读 (系数是否符合经济逻辑、稳健性是否足以支撑论点、最终论文怎么写)。夹在这两端之间的数据清洗、脚本编写、表格排版、稳健性矩阵执行、格式核查,全部自动化。
这个分工的核心价值是把研究者从机械执行里解放出来。过去一个博士生可能花一整周去配齐 36 格稳健性矩阵,现在 40 分钟就能跑完,节省出的时间用在判断”哪些稳健性检验真正回应审稿人关切”这件更重要的事上。AI 不是在替代研究者,而是让研究者的判断力覆盖更大的工作量。
迁移到其他子领域
本章的案例以劳动经济学为场景,但整个四件套框架不局限于 DID。四个主要经济学子领域的迁移对照如下。
金融实证
事件研究法 (Event Study)
did-estimate 换为 event-study Skill,以 eventstudy2 或 did_imputation 为底层命令;CLAUDE.md 加入 CRSP/Compustat 的本地化路径规范
发展经济学
RCT / IV
Skill 拆分为 balance-check(处理与控制组平衡)+ iv-estimate(首阶段 F 统计量 + Hansen J 检验);子代理需要覆盖弱工具变量诊断
公共经济学
财政转移 RDD
Skill 以 rdrobust 为核心,加入 bandwidth-choice 子 Skill 让 AI 跑 CCT 最优带宽并输出敏感性曲线;HITL 节点多一个”带宽选择是否合理”的检查
环境经济学
排放 IV / 合成控制
稳健性矩阵维度变为”工具变量集 × 样本 × 估计量”;sdid 常作为主回归之一,不只做稳健性;数据许可风险较高(EPA 微观数据)
迁移时只需替换三个位置:CLAUDE.md 的变量命名约定与许可声明、Skills 中的具体 Stata 命令、稳健性矩阵的维度定义。dataprep-agent / estimator-agent / reviewer-agent 三个子代理的分工逻辑几乎不用改。
AI 把研究者从机械执行里解放出来,让判断力得以专注在真正难的问题上——识别策略是否站得住、样本边界是否合理、结论在哪些维度上稳健。Skills 可以跑遍矩阵,子代理可以核查格式,Hooks 可以拦截遗漏,但”研究问题是否值得做”、“结论是否可信”这两个最上游和最下游的判断,永远留给人。