跳到主内容
方法论
7
AI 教师
研究者

AI 原生课程设计工作流:从大纲到可上的课

7 步把一门课从空白大纲推到可立即开课的状态。

一门 16 周的研究生课从空白大纲推到「能开学」的状态——大纲、讲义、习题、阅读单、评分细则全部 AI 协作生成、人来定调。

4 分钟阅读#课程设计#教学#讲义#习题#评分#经济学

我们用这条工作流跑过 3 门课:博弈论(本科 + 研究生)、行为经济学(研究生)、网络经济学(研究生)。每门课从立项到开学第一周可以稳定压到 5-7 天的实际工作量——前提是你已经讲过这门课的相关内容、心里清楚学生该学到什么。如果是从零开新课,agent 帮不上忙:课程设计的核心永远是"你想让学生离开教室时变成什么样的人",这件事 agent 没法替你判断

下面 7 步覆盖一门 16 周课从大纲到开学的完整路径。每一步都明确"哪些必须老师自己拍板、哪些可以放心交给 agent"。

老师本人 · 不交给 agent

正式做大纲之前,先写两份单子:

  • 学习目标:学生学完应当能做的 5-8 件具体事("能用纳什均衡分析二人博弈"、"能识别一个研究里的 selection bias 并提出补救"),每条要可考核。
  • 不教什么:明确纳入这门课的内容("不教 GTO 求解算法的内部实现"、"不教 Stata 的 esttab 用法")——这是控制 scope 的关键。

这两份单子加起来 200-400 字,进 git。它是后续所有内容生成 prompt 的共同上下文,也是期末判断"这门课是否成功"的标尺。

planner · 全新 context

把学习目标 + 不教什么 + 你已有的素材清单(讲过的笔记、看过的教材、读过的论文)交给 planner agent,让它出16 周大纲:每周题目、核心概念、必读、推荐阅读、对应的习题/案例。

planner 通常会犯两类错:把节奏排得太密(一周塞三个理论),或把同一个概念反复出现在多周。老师拿到草案后必须做一次"教学节奏复核"——把每周的认知负荷 1-5 打分,确保学期前 3 周和期中两周明显轻一点。

我们的经验是 planner 的草案被采纳率大约 60-70%;剩下 30-40% 是老师按"我知道学生在哪里会卡住"亲自调整——这部分判断 agent 现在还做不了。

writer · 复用书稿 skill

大纲定稿后,把每周的题目 + 核心概念 + 必读论文(带 BibTeX)+ 学习目标交给 writer agent,让它产出讲义初稿:教学动机、核心概念、推导(如果有)、配图建议、与上一周/下一周的衔接。

讲义形态我们统一用 Quarto 写:每周一个 week-XX.qmd,含可执行代码块(R / Python)。这套和书稿工作流共用同一条 /write-section skill,prompt 几乎不变——只是把"读者画像"从"经管硕士"换成"选修这门课的学生"。

tool · Quarto · 课件模板

打开

讲义、slides、习题、解答四件套用 Quarto 同一份源文件渲染:format: revealjs 出 slides;format: html 出讲义;format: pdf 出阅读版;同一个 .qmd 写一次,输出三种载体,避免维护多份。

writer 出题 / reviewer 解题

每周配 4-8 道习题,分三档:

  • 基础题:直接套用本周概念。
  • 应用题:需要联用本周与之前的概念,通常给一个简化的现实场景。
  • 拓展题:开放问题,留给学有余力的同学。

writer agent 先按这个分档出题。然后开一个全新对话让 reviewer agent 认真解一遍每道题——agent 解不出来或解得很别扭的题,往往就是题目本身有问题(条件不全、答案歧义、超纲)。这一步能把出错率压到非常低,亲测在博弈论课上 100 道题里只剩 3 处需要老师改条件。

案例(case study)建议老师本人写:用真实数据 + 真实情境,agent 编不出来。可以用 agent 帮你把案例改写成不同长度版本(课堂版 / 作业版 / 期末版)。

searcher · 全自动 / curator · 老师裁剪

每周 2-4 篇必读 + 4-8 篇推荐阅读。把本周题目交给 searcher agent,让它输出 30-50 篇候选论文,每篇带:研究问题、方法、发表 venue、与本周题目的关系标签。

老师亲自从候选里挑——这一步 agent 不能替代,因为"读哪篇"涉及多重判断:哪一篇能让学生学到方法、哪一篇能引发讨论、哪一篇与课堂论证形成对照。挑完后让 curator agent 给每篇写100 字的导读,告诉学生"为什么读这篇 / 重点看哪一节"——这能显著提高学生的阅读率。

rubric writer · 严格规则约束

期末前一定要有写好的评分细则,否则 TA 改作业不一致、学生申诉时你站不住。把每类作业的目的("考核学生是否能识别博弈结构")+ 学习目标交给 rubric writer agent,让它产出详细分档评分表:每档(A/B/C/D/F 或满分细分)需要满足什么、典型扣分点、给 TA 的判分指引。

agent 写出来的细则初稿一定有偏严或偏松——老师拿到后要拿一份历年学生作业(如果有)实际打一遍分,校准档位。这一步约 1 小时,能省下整学期 TA 与学生的来回扯皮。

tool · 自定义 rubric skill

打开

我们把"按学习目标 + 题型生成评分细则"封成 skill,复用率很高——同一门课不同年份只需要更新学习目标,rubric 不用从头写。

老师本人 · 终审

开学前一周,把整套课件当成学生走一遍:把 16 周讲义按顺序翻一遍、做 3-4 周的习题、读 5-6 篇必读。这一步通常会发现:

  • 某周讲义和大纲不一致(agent 跨周生成时偶尔会记混上下文)。
  • 某道习题在前几周还没讲到的工具上依赖。
  • 某篇必读其实不该放在这一周。

最后找 1-2 个目标学生(已选课的、上过先导课的)做小范围预演:让他们看大纲和第一周讲义,问"你觉得这门课讲什么、对你有什么用、哪里看不懂"。预演里冒出来的问题,比期末评教反馈早 4 个月——一定要补上去。

到这一步课程进入"可开课"状态。开学之后的迭代走 changelog(每周课后写一条"本周哪里讲得不好、明年怎么改"),积累 2-3 轮就能把课打磨成自己的代表作。

这条工作流的几个关键约束

  • 学习目标 + 不教什么这两份单子是所有 prompt 的共同上下文,写不清楚,后面所有 agent 输出都会偏。
  • 大纲、阅读单、案例、评分细则——这四件事老师必须亲自把关,agent 只能给草案。
  • 习题让 reviewer agent 真解一遍——这是最便宜也最有效的查错手段。
  • 课件、slides、习题、解答用同一份 Quarto 源文件——一处改、四处生效,不要各自维护。
  • 开课前必须自走 + 学生预演——agent 的盲点必须靠真实人来发现。

7 步连起来跑,从立项到开学一周大约 5-7 天的实际工作量(不含老师本人对内容的判断时间——那部分看课程深度,从几周到几个月都有)。agent 把"扩写、出题、找文献、写细则、整理 slides"这五件事接走以后,老师真正需要花精力的就只剩下"我希望学生离开教室时变成什么样的人"——这刚好是老师的本职。

推荐工具

  • Claude Code · /write-section skill — 讲义章节扩写(与书稿工作流同一条)。
  • Quarto — 讲义 / slides / 习题统一源文件。
  • academic-paper-search skill — 阅读单候选检索。
  • rubric skill — 评分细则模板生成。
  • 岭南 AI 开放平台 /resources — 我们整理的教学类工具与模板(slides、rubric、习题)。
related workflows