方法论

7 步

AI 教师

研究者

AI 原生课程设计工作流：从大纲到可上的课

7 步把一门课从空白大纲推到可立即开课的状态。

一门 16 周的研究生课从空白大纲推到「能开学」的状态——大纲、讲义、习题、阅读单、评分细则全部 AI 协作生成、人来定调。

2026年5月11日4 分钟阅读#课程设计#教学#讲义#习题#评分#经济学

工作流步骤 · 7 步展开 ↓

先写「学习目标」与「不教什么」
16 周大纲与节奏（planner agent）
每周讲义初稿（writer agent · 章节式扩写）
习题与案例（writer + reviewer agent）
阅读单（searcher + curator agent）
评分细则（rubric writer agent）
开学前一周：自走一遍 + 学生预演

我们用这条工作流跑过 3 门课：博弈论（本科 + 研究生）、行为经济学（研究生）、网络经济学（研究生）。每门课从立项到开学第一周可以稳定压到 5-7 天的实际工作量——前提是你已经讲过这门课的相关内容、心里清楚学生该学到什么。如果是从零开新课，agent 帮不上忙：课程设计的核心永远是"你想让学生离开教室时变成什么样的人"，这件事 agent 没法替你判断。

下面 7 步覆盖一门 16 周课从大纲到开学的完整路径。每一步都明确"哪些必须老师自己拍板、哪些可以放心交给 agent"。

先写「学习目标」与「不教什么」

老师本人 · 不交给 agent

正式做大纲之前，先写两份单子：

学习目标：学生学完应当能做的 5-8 件具体事（"能用纳什均衡分析二人博弈"、"能识别一个研究里的 selection bias 并提出补救"），每条要可考核。
不教什么：明确不纳入这门课的内容（"不教 GTO 求解算法的内部实现"、"不教 Stata 的 esttab 用法"）——这是控制 scope 的关键。

这两份单子加起来 200-400 字，进 git。它是后续所有内容生成 prompt 的共同上下文，也是期末判断"这门课是否成功"的标尺。

16 周大纲与节奏（planner agent）

planner · 全新 context

把学习目标 + 不教什么 + 你已有的素材清单（讲过的笔记、看过的教材、读过的论文）交给 planner agent，让它出16 周大纲：每周题目、核心概念、必读、推荐阅读、对应的习题/案例。

planner 通常会犯两类错：把节奏排得太密（一周塞三个理论），或把同一个概念反复出现在多周。老师拿到草案后必须做一次"教学节奏复核"——把每周的认知负荷 1-5 打分，确保学期前 3 周和期中两周明显轻一点。

我们的经验是 planner 的草案被采纳率大约 60-70%；剩下 30-40% 是老师按"我知道学生在哪里会卡住"亲自调整——这部分判断 agent 现在还做不了。

每周讲义初稿（writer agent · 章节式扩写）

writer · 复用书稿 skill

大纲定稿后，把每周的题目 + 核心概念 + 必读论文（带 BibTeX）+ 学习目标交给 writer agent，让它产出讲义初稿：教学动机、核心概念、推导（如果有）、配图建议、与上一周/下一周的衔接。

讲义形态我们统一用 Quarto 写：每周一个 week-XX.qmd，含可执行代码块（R / Python）。这套和书稿工作流共用同一条 /write-section skill，prompt 几乎不变——只是把"读者画像"从"经管硕士"换成"选修这门课的学生"。

tool · Quarto · 课件模板

打开

讲义、slides、习题、解答四件套用 Quarto 同一份源文件渲染：format: revealjs 出 slides；format: html 出讲义；format: pdf 出阅读版；同一个 .qmd 写一次，输出三种载体，避免维护多份。

习题与案例（writer + reviewer agent）

writer 出题 / reviewer 解题

每周配 4-8 道习题，分三档：

基础题：直接套用本周概念。
应用题：需要联用本周与之前的概念，通常给一个简化的现实场景。
拓展题：开放问题，留给学有余力的同学。

writer agent 先按这个分档出题。然后开一个全新对话让 reviewer agent 认真解一遍每道题——agent 解不出来或解得很别扭的题，往往就是题目本身有问题（条件不全、答案歧义、超纲）。这一步能把出错率压到非常低，亲测在博弈论课上 100 道题里只剩 3 处需要老师改条件。

案例（case study）建议老师本人写：用真实数据 + 真实情境，agent 编不出来。可以用 agent 帮你把案例改写成不同长度版本（课堂版 / 作业版 / 期末版）。

阅读单（searcher + curator agent）

searcher · 全自动 / curator · 老师裁剪

每周 2-4 篇必读 + 4-8 篇推荐阅读。把本周题目交给 searcher agent，让它输出 30-50 篇候选论文，每篇带：研究问题、方法、发表 venue、与本周题目的关系标签。

老师亲自从候选里挑——这一步 agent 不能替代，因为"读哪篇"涉及多重判断：哪一篇能让学生学到方法、哪一篇能引发讨论、哪一篇与课堂论证形成对照。挑完后让 curator agent 给每篇写100 字的导读，告诉学生"为什么读这篇 / 重点看哪一节"——这能显著提高学生的阅读率。

评分细则（rubric writer agent）

rubric writer · 严格规则约束

期末前一定要有写好的评分细则，否则 TA 改作业不一致、学生申诉时你站不住。把每类作业的目的（"考核学生是否能识别博弈结构"）+ 学习目标交给 rubric writer agent，让它产出详细分档评分表：每档（A/B/C/D/F 或满分细分）需要满足什么、典型扣分点、给 TA 的判分指引。

agent 写出来的细则初稿一定有偏严或偏松——老师拿到后要拿一份历年学生作业（如果有）实际打一遍分，校准档位。这一步约 1 小时，能省下整学期 TA 与学生的来回扯皮。

tool · 自定义 rubric skill

打开

我们把"按学习目标 + 题型生成评分细则"封成 skill，复用率很高——同一门课不同年份只需要更新学习目标，rubric 不用从头写。

开学前一周：自走一遍 + 学生预演

老师本人 · 终审

开学前一周，把整套课件当成学生走一遍：把 16 周讲义按顺序翻一遍、做 3-4 周的习题、读 5-6 篇必读。这一步通常会发现：

某周讲义和大纲不一致（agent 跨周生成时偶尔会记混上下文）。
某道习题在前几周还没讲到的工具上依赖。
某篇必读其实不该放在这一周。

最后找 1-2 个目标学生（已选课的、上过先导课的）做小范围预演：让他们看大纲和第一周讲义，问"你觉得这门课讲什么、对你有什么用、哪里看不懂"。预演里冒出来的问题，比期末评教反馈早 4 个月——一定要补上去。

到这一步课程进入"可开课"状态。开学之后的迭代走 changelog（每周课后写一条"本周哪里讲得不好、明年怎么改"），积累 2-3 轮就能把课打磨成自己的代表作。

这条工作流的几个关键约束

学习目标 + 不教什么这两份单子是所有 prompt 的共同上下文，写不清楚，后面所有 agent 输出都会偏。
大纲、阅读单、案例、评分细则——这四件事老师必须亲自把关，agent 只能给草案。
习题让 reviewer agent 真解一遍——这是最便宜也最有效的查错手段。
课件、slides、习题、解答用同一份 Quarto 源文件——一处改、四处生效，不要各自维护。
开课前必须自走 + 学生预演——agent 的盲点必须靠真实人来发现。

7 步连起来跑，从立项到开学一周大约 5-7 天的实际工作量（不含老师本人对内容的判断时间——那部分看课程深度，从几周到几个月都有）。agent 把"扩写、出题、找文献、写细则、整理 slides"这五件事接走以后，老师真正需要花精力的就只剩下"我希望学生离开教室时变成什么样的人"——这刚好是老师的本职。

AI 原生课程设计工作流：从大纲到可上的课

先写「学习目标」与「不教什么」

16 周大纲与节奏（planner agent）

每周讲义初稿（writer agent · 章节式扩写）

习题与案例（writer + reviewer agent）

阅读单（searcher + curator agent）

评分细则（rubric writer agent）

开学前一周：自走一遍 + 学生预演

这条工作流的几个关键约束

推荐工具

AI 原生书稿工作流：从大纲到第一稿

AI 原生产品发布工作流：从想法到上线

AI 辅助论文写作工作流：从想法到投稿

其他工作流

AI 原生书稿工作流：从大纲到第一稿

AI 原生产品发布工作流：从想法到上线

AI 辅助论文写作工作流：从想法到投稿

相关标签