19.5 文献综述写作

面向经管学生、研究者与从业者的 AI 智能体设计教材

作者

李学恒、林建浩、严翊歆

发布于

2026-05-11

Writer-Reviewer 迭代写作循环

前四个阶段完成了原材料准备:文献已检索收集、分类管理、读取提取、引用验证。这一节进入产出阶段——先用 GRADE 框架评价文献质量,再通过两阶段写作法和 Writer-Reviewer 迭代生成综述。

GRADE 框架评价文献质量

综述写作的前置步骤是判断每篇论文的证据强度,决定在综述中给予多大权重。GRADE 框架(Grading of Recommendations Assessment, Development and Evaluation)提供了系统化的评价方法。

GRADE 四级证据质量
等级 含义 起始点
对效应估计有高度信心 设计良好的随机实验
真实效应可能接近估计值 有一定局限的实验
对估计值的信心有限 观察性研究
极低 估计值可能与真实效应差距很大 有严重缺陷的研究

五个降级因素决定证据质量是否需要下调:偏倚风险、不一致性(不同研究结论矛盾)、间接性(研究对象与综述问题不匹配)、不精确性(样本量不足)、发表偏倚。

三个升级因素可以上调观察性研究的证据等级:大效应量、剂量-反应关系、混杂因素会削弱效应(说明真实效应更强)。

经济学适配

GRADE 最初为临床医学设计,近年在社会科学领域也逐渐被采用。经济学研究有自己的因果推断传统,其识别策略(Identification Strategy)可以这样对应到 GRADE 等级:

识别策略 GRADE 起始等级 说明
随机对照实验(RCT) 田野实验、实验室实验
断点回归(RDD) 中-高 取决于断点处的操纵检验
双重差分(DID) 取决于平行趋势假设的可信度
工具变量(IV) 取决于排他性约束和工具相关性
面板固定效应 低-中 控制了时间不变的遗漏变量
横截面 OLS 难以排除遗漏变量偏误
▶ Claude Code
读取 literature_notes/summary_table.md 中的文献摘要表,
对每篇论文按 GRADE 框架进行证据质量评价。
重点评估:
1. 识别策略的可信度(RCT/RDD/DID/IV/OLS)
2. 样本量和数据质量
3. 结论的稳健性(是否做了多种检验)
4. 与其他研究的一致性
输出为表格格式,包含论文标题、GRADE 等级、评分理由。
保存到 literature_notes/grade_assessment.md。

两阶段写作法

文献综述写作的常见失误是”逐篇总结”——把每篇论文的摘要依次罗列,缺乏跨论文的综合分析。这里采用两阶段写作法(先大纲后扩展)来避免这个问题。这不是学界的正式方法论名称,而是一种实用的写作策略。

K-Dense Scientific Skills 提供了 /literature-review Skill,可以直接调用两阶段写作法。

阶段一:生成主题化大纲。基于文献摘要表,按主题而非按论文组织综述骨架:

▶ Claude Code
用 /literature-review 基于 literature_notes/summary_table.md 和 literature_notes/grade_assessment.md,
生成主题化文献综述大纲。要求:
1. 按主题组织,不要按论文逐篇列举
2. 每个主题下标注相关论文和核心论点
3. 标记主题之间的逻辑关系和转承
4. 在大纲末尾标注已识别的研究空白
保存到 drafts/outline.md。

大纲生成后,先确认主题划分和覆盖范围是否合理,再进行下一步。

阶段二:扩展为完整段落。将大纲中的要点转化为连贯的叙事段落。每个段落综合多篇论文的发现,而非复述单篇论文的内容:

▶ Claude Code
用 /literature-review 基于 drafts/outline.md 大纲,将每个主题扩展为完整的综述段落。要求:
1. 每段综合 3-5 篇论文的发现,按论点而非论文组织
2. 使用 APA 格式的行内引用(Author, Year)
3. 对矛盾的结论要明确指出分歧并分析可能原因
4. 每个主题结尾概括该方向的现有共识和待解决问题
5. GRADE 评级为高或中的论文给予更大权重
输出保存到 drafts/review_v1.md。

子代理分工

当综述涉及大量论文时,可以用子代理将工作拆分为并行任务:

代理 职责 输入 输出
检索代理 执行搜索和文献摄入 搜索关键词 论文列表 + 摘要表
评价代理 运行 GRADE 评分 摘要表 质量评估报告
写作代理 撰写综述段落 大纲 + 摘要表 + 评估报告 综述初稿
主代理 协调分工、审核、整合 各代理输出 最终综述

写作代理的配置示例:

▶ Agent
---
name: review-writer
description: 撰写主题式文献综述段落,综合多篇论文发现
model: opus
tools:
  - Read
  - Write
  - Edit
---

你是一位学术写作代理,负责撰写文献综述的正文段落。

## 写作原则

- 按主题组织,不要逐篇总结
- 每段综合 3-5 篇论文,突出共识、分歧和演进脉络
- 使用 APA 格式行内引用
- 对矛盾结论要分析原因(方法差异、样本差异、时间跨度)
- 区分"作者声称"和"证据支持"

## 输入

- drafts/outline.md:综述大纲
- literature_notes/summary_table.md:文献摘要表
- literature_notes/grade_assessment.md:GRADE 评估结果

## 输出

将综述正文写入 drafts/review_v1.md,每个主题一个二级标题。

审阅代理的配置示例:

▶ Agent
---
name: review-checker
description: 审阅文献综述初稿,检查引用准确性、逻辑连贯性和综合深度
model: sonnet
tools:
  - Read
  - Write
---

你是一位学术审阅代理,负责检查文献综述的质量。

## 审阅维度

- 引用准确性:每条引用是否与 literature_notes/summary_table.md 一致
- 覆盖完整性:摘要表中的核心论文是否都被提及
- 综合深度:是否做到了跨论文综合,而非逐篇罗列
- 逻辑连贯性:段落之间的转承是否自然
- 研究空白:是否明确指出了尚未解答的问题

## 输入

- drafts/review_v1.md:综述初稿
- literature_notes/summary_table.md:文献摘要表
- literature_notes/grade_assessment.md:GRADE 评估结果

## 输出

将审阅意见写入 drafts/review_feedback_v1.md,按维度列出具体问题。

Writer-Reviewer 迭代

综述初稿完成后,通过写作-审阅循环提升质量。一轮迭代包含三步:

  1. 写作代理生成或修改综述段落
  2. 审阅代理检查初稿,输出问题清单
  3. 写作代理根据问题清单修订

审阅代理的检查维度:

维度 检查内容
引用准确性 每条引用是否与原文摘要表一致,是否存在张冠李戴
逻辑连贯性 段落间是否有清晰的逻辑过渡,论证链是否完整
覆盖完整性 摘要表中的核心论文是否都在综述中被提及
综合深度 是否做到了跨论文综合,而非逐篇罗列
研究空白 是否明确指出了现有文献尚未解答的问题

两种审阅方式适用于不同场景:

  • review-checker 子代理:适合多轮迭代。子代理在后台独立运行,自动按五个维度逐项检查,输出结构化的问题清单,写作代理据此修订。适合综述篇幅较长、需要 2-3 轮打磨的情况。
  • 直接提示词审阅:适合快速单轮检查。在主对话中直接发出审阅指令,Claude Code 即时返回反馈,适合综述接近定稿时的最终检查。

快速单轮审阅的示例:

▶ Claude Code
审阅 drafts/review_v1.md 综述初稿,对照 literature_notes/summary_table.md 检查:
1. 引用准确性:每条引用是否与原文信息一致
2. 覆盖完整性:有哪些核心论文被遗漏
3. 综合深度:哪些段落只是在罗列论文而缺乏综合分析
4. 逻辑连贯性:段落之间的转承是否自然
将审阅意见保存到 drafts/review_feedback_v1.md。

多轮迭代时,使用子代理效率更高——review-checker 自动生成结构化反馈,review-writer 据此修订,主代理只需协调轮次。通常迭代 2-3 轮即可达到可接受的质量。

引用嵌入与验证

综述定稿前,需要完成两项收尾工作:

引用嵌入。确保正文中的每条行内引用(如 Odean, 1998)都能在参考文献列表中找到对应条目,反之亦然。

交叉验证。将综述中对某篇论文的描述与文献摘要表中的原始提取信息进行比对,确认没有错误转述。

▶ Claude Code
对 drafts/review_final.md 进行引用完整性检查:
1. 列出正文中所有行内引用
2. 与 citations/references.bib 交叉比对,标记正文中有但参考文献中没有的引用
3. 标记参考文献中有但正文中未引用的条目
4. 输出检查报告到 drafts/citation_check.md
AI 幻觉引用风险

大语言模型可能编造看似真实但实际不存在的论文引用。防范措施:

  • 在 CLAUDE.md 的写作规范中加入这条规则:所有引用必须来自 literature_notes/summary_table.md 中的已验证条目,禁止引用摘要表之外的论文。这条规则写入规则文件后,Claude Code 在每次写作时都会遵守。
  • 定稿前,用 /citation-management 对所有引用 DOI 做一次 CrossRef 验证
  • 对无 DOI 的工作论文,手动确认其在 SSRN 或 RePEc 上可查到