AI 辅助论文写作工作流:从想法到投稿
8 步把一个粗糙的研究想法推到可投顶刊的工作论文初稿。
把一个研究问题从「读了点文献的草稿状态」推到可投稿状态——8 步流程,3 个 agent 角色,配套 prompt 模板。
写一篇能投出去的实证论文,瓶颈不在 idea,也不在跑数据——而在怎么把一个粗糙的想法稳定地推到可投稿的状态。这条工作流是我们这两年带博士生反复跑下来的版本,已经在 4 篇工作论文上稳定复现。它的前提仍然是:判断、idea、识别策略仍然在你;agent 接管的是文献整理、结构梳理、语言打磨、引文校对这些消耗精力但不需要研究判断的工作。
下面 8 步覆盖一个 idea 从「读了点文献的草稿状态」到投稿前的最后一稿。每一步都有清楚的输入输出,方便指导学生时直接照着跑。
作者本人 · 不交给 agent
正式动笔之前,先写一份 300 字的研究备忘录:研究问题是什么、为什么重要、这一篇有什么是别人没说的、识别策略是什么、用什么数据。这一步绝对不交给 agent——它是研究判断本身。备忘录写不顺,说明 idea 还没成熟,先回去想清楚再说。
备忘录就保存在仓库的 memo.md,每次想法迭代都进 git。审稿人最常问的"你的 contribution 到底是什么",答案应当能从这 300 字直接读出来。
searcher / note-taker · 独立 context
把研究问题与关键概念交给 searcher agent,让它输出一份候选文献清单:每条带 DOI、引用次数、与本文的关系标签("竞争假说"/"测度方法"/"机制证据"/"政策背景")。Searcher 只搜不读。然后把清单交给 note-taker agent 逐篇精读,输出结构化笔记:研究问题、识别策略、数据、结论、对本文的启发与冲突。
tool · academic-paper-search skill
打开我们把多源文献检索(arXiv / NBER / SSRN / CrossRef / OpenAlex)封成一个 skill,输入研究问题 + 关键词,输出 BibTeX + 元数据 JSON。比起自己开 10 个浏览器 tab,能把检索阶段从一天压到一小时。
作者本人 · 关键判断步
note-taker 输出的是笔记,不是骨架。这一步必须由作者亲自做:把笔记按论证需要重排——本文与既有文献的关系图(哪几篇是直接前序,哪几篇是竞争解释,哪几篇是方法借鉴),然后写一份 500 字的 introduction 大纲,明确"我想让审稿人在读完 intro 时相信什么"。
骨架决定了论文的命门。这一步交给 agent 等于把论文 framing 让给机器——agent 写出来的 intro 永远是"很多人研究了 X,但没人研究 Y,所以本文研究 Y"这种空话。
writer · Claude Code
骨架定稿后,把每一节的小节标题 + 论点 + 必要素材交给 writer agent,让它扩写成正文段落。提示里讲明读者画像("经济学顶刊审稿人,方法挑剔但不会读你内心")和绝不能编造的内容(人名、文献、数字、估计系数、识别条件)。
实证主体(数据描述、识别策略、主回归)建议作者本人手写第一稿,writer 只做语言打磨。综述、机制讨论、稳健性脚注这类相对程式化的段落可以全交给 writer。
tool · Claude Code · /write-section skill
打开和书稿工作流共用同一个 /write-section skill:输入小节大纲与参考文献 BibTeX,输出符合 LaTeX 章节风格的 .tex 片段,自动加上正确的 \cite{} 与定理编号。
reviewer · 全新对话
正文写完后开一个全新的 Claude 对话,把整篇论文丢进去,让 reviewer agent 模拟一名挑剔的顶刊审稿人,逐节给出:
- 逻辑检查:claim 是否有证据支持,证据是否真的支持 claim,identification 是否在论证中保持一致。
- 事实核对:每一处引用、数字、年份、机构名、政策名——逐一标记。
- 审稿人会问的问题:列出 5-10 个"如果我是 referee 会写在 report 里的问题"。
reviewer 的输出是 referee-pre-report.md,绝不直接改正文。改不改、怎么改、是否需要补回归——这是作者的判断。把 referee 提的问题在投稿前自己回答一遍,是这条工作流给得最多的 ROI。
工具脚本 + 作者复核
LLM 生成的论文里最常见的错误是编造引用——非真实的文献、错的年份、把 A 的论文挂到 B 名下。这一步必须全自动跑一遍:
/bib-citation-validatorskill 把.bib里每条 entry 比对 Zotero 本地库 + CrossRef + OpenAlex,标出"在 Zotero 里没找到"和"DOI 解析失败"两类。- 工作论文要确认是否已有正式发表版本(
unpaywall-apiskill)。 - 生成 CSV 报告,作者逐条勾选是否替换。
我们在第一篇用这条流程的论文里发现了 7 条 LLM 编造的引用——投稿前发现就是工作流救命,投稿后被 referee 抓到就是事故。
reviser · 仅做语序与一致性
把全文(latex 源码)+ referee-pre-report 中作者勾选的修改清单交给 reviser agent。reviser 只做三件事:把勾选的修改落到位、统一术语 / 时态 / 人称、把过长复合句拆短。不允许引入新论点、新引用、新数字、新表格——这条规矩写进 system prompt,越界就重跑。
英文写作建议在最后再过一遍 native-speaker 风格 prompt("以 AER author 的风格重写,保留所有数学符号与引用编号"),但不要让它改 abstract——abstract 应当作者亲自定稿。
作者本人 · 终审
pdflatex && bibtex && pdflatex && pdflatex 编译完整 PDF,只看 PDF 不看源码通读一遍。然后对照投稿目标期刊的 submission checklist 逐项过:abstract 字数、JEL codes、keyword 数量、figure / table 编号、appendix 顺序、致谢与利益冲突声明。
到这一步论文进入"可投稿"状态。后续 referee 反馈的迭代不再走这条工作流,而是用 /latexdiff-pdf 跟踪 revision 高亮、按 referee 的编号逐条回复。
这条工作流的几个关键约束
- searcher 只搜不读,note-taker 只读不综合,synthesizer 由作者本人扮演——agent 越擅长综合,越容易把研究判断让出去。三个角色的边界要在 prompt 里写死。
- reviewer 必须开新 context——同一对话里 writer 出来的内容和 reviewer 自带 confirmation bias,新对话才能读出真问题。
- 引文校对是非协商项——LLM 一定会编造引用,没有例外。
- 作者亲手写的部分:memo、骨架、identification 段落、abstract、cover letter——这五处只能 writer 当语言润色用,不能让它生成。
把这八步连起来跑,一篇 30-40 页的实证论文从 idea 到投稿大约 3-4 个月(含数据清洗与回归本身)。其中纯写作部分能压到 4-6 周;agent 把"找文献、读文献、写程式化段落、查引文、统一术语"这些事接走以后,作者真正需要花精力的就只剩下研究判断与改稿——这刚好是论文里最该花时间的地方。
推荐工具
- academic-paper-search — 多源文献检索(arXiv / NBER / SSRN / CrossRef / OpenAlex)。
- bib-citation-validator — 严格规则的 LaTeX/BibTeX 引文核对。
- latexdiff-pdf — revision 跟踪、自动出 redline PDF。
- Claude Code 的
/write-section与/researchskill — 章节扩写与文献调研。 - 岭南 AI 开放平台 /resources — 我们整理的研究类工具与模板入口。