跳到主内容
✍️ 公众号文章
研究者
AI 教师

Agent Skills:记住你的偏好、复制你的经验

介绍 Anthropic 的 Agent Skills 概念:用自然语言为 AI 写操作手册,沉淀专业经验。讲解其文件结构、渐进式加载机制,并列举学术科研中文献综述、论文修改、课件制作等五大应用场景与上手路径。

李学恒8 分钟阅读#agent-skills#claude-code#ai-workflow#literature-review#teaching-automation

created: 2026-02-14 tags:

  • type/article
  • status/draft
  • AI/claude-code
  • topic/ai-workflow
  • topic/academic-research aliases: [Agent Skills 入门, Skills 学术应用, 给AI写操作手册]

上一篇介绍 Sant'Anna 的 Claude Code 工作流的文章爆火了。短短几天,1 万+ 阅读,2 千+ 转发。这个数据说明 Claude Code 在学术圈的关注度正在迅速上升。

但要真正理解 Sant'Anna 的工作流,并进一步根据自己的工作需求去定制自己的 CC 工作流、最大化生产力,你还需要了解 2025 年下半年以来 AI 应用圈仅次于 agent 的第二大热词——Agent Skill。Anthropic 最近发布了一份 33 页的官方教程,专门讲这个东西。读完之后我觉得有必要写一篇后续,把 Skill 这个概念讲清楚,尤其是讲清楚它跟我们的教学科研到底有什么关系。

Skill 是什么?简单说,它是你给 AI 写的操作手册。不需要编程,不需要命令行,全用自然语言编写就行。写好一次,以后每次它都按你的标准和流程来干活,沉淀下你多年积累的行业经验和专业判断,将以后每一次同类工作的边际成本变为零。

Skill 到底是什么

在解释 Skill 之前,先说说我们现在大多数人用 AI 的方式。

打开 ChatGPT 或 Claude 的对话框,把你的需求敲进去,等它回答。这种用法相当于在街上随便拉了个路人问路。路人可能很聪明,但他不了解你的情况,无法帮你填年终总结报告;不了解你的数据,无法帮你跑回归不出错;不了解你的论文报告写作要求,写出来的文字总有 AI 味;不了解你演示文稿的审阅修订标准,最后只能靠人工来来回回反复纠错。

进阶一点的做法是配置项目背景。比如 Claude Code 里的 CLAUDE.md,任何时候这个文档都会第一时间被完整喂给 AI,因此你可以把项目信息、个人偏好、常用文件路径都写进去。这相当于给新来的研究助理做了入职培训:交代背景、说明规矩。但每次遇到新任务、新开一个项目,你得重新创建这个 CLAUDE.md,而每个项目的背景信息都不同。最大的问题是,整个 CLAUDE.md 每次都会被完整加载,所以不能过长——什么都往里塞,AI 的注意力反而被分散,等于什么都没说,导致上下文腐烂。所以你不可能把一个项目里所有子任务的具体流程全塞进这一个文档。

但想想,每个项目其实都是一些有相对固定流程和标准的小任务的排列组合——跑回归、写文献综述、做 robustness check、出考试题、写会议纪要。项目不同,但这些小任务反复出现,流程大同小异。

Skill 就是给这些小任务写的操作说明书。针对某个具体任务,把完整的操作流程写下来——标准是什么、如何调用外部工具、分几步做、每步检查什么、做完怎么自检。这相当于你训练了一年的 RA,已经完全内化了你的工作方式,拿到任务就能按你的标准独立完成。Skill 独立于项目,写好一个,所有项目都能复用。

Skill 并不神秘。回到具体操作上,一个 Skill 其实就只是一个文件夹:

your-skill-name/
├── SKILL.md          # 必需,主说明文件
├── scripts/          # 可选,可执行脚本 (Python, Bash)
├── references/       # 可选,参考文档
└── assets/           # 可选,模板、字体、图标

核心是这个 SKILL.md,用 Markdown 写成,放着所有指令。旁边可以放参考文档、脚本、模板,AI 按需加载。Anthropic 官方文档用了一个厨房比喻:MCP(Model Context Protocol,让 AI 连接外部工具的协议)给 AI 提供厨房里的锅碗瓢盆和食材,Skill 给它菜谱。光有工具没菜谱,做出来的菜全凭手感;有了菜谱,每次出品都能稳定达标。

写 Skill 不需要编程,里面的整个主体内容都可以用纯自然语言来写。你会用自然语言描述清楚某类任务的流程和标准,就会写 Skill。本质上就是把你脑子里的操作标准用文字写出来。

举个例子:从教材到讲座音频

说一个我自己在用的例子。

假设下周要给本科生讲网络经济学的某一章。没有 Skill 的时候怎么做?把教材章节粘给 AI,说“帮我写个讲稿”。出来的东西像论文摘要——概念罗列、逻辑紧凑,但干巴巴的,没有教学节奏,没有互动设计,不像一个人站在讲台上讲课。你改一遍,比自己从头写还累。

有 Skill 之后呢?我写了一个叫 lecture-generation 的 Skill。它的操作手册里定义了完整的讲座生成流程,分四个阶段:先分析教材内容、设计 25-30 分钟的讲座框架和 8-12 个修辞性提问;然后写出 5000-6000 字的口语化讲稿,数学公式用文字描述而不是符号;接着从教学设计、内容准确性、受众匹配度、语言自然度四个维度自我审查,总分不到 7 分退回重写;最后定稿,还能调用 GPU 服务器把文字合成为音频。

教材章节 → [规划] → [写作] → [审查] → [定稿] → 讲座音频
                                ↓ <7分
                        退回重写 ──→ [写作]

输入是一章教材,输出是一段讲座音频。整个过程我只需要指定用哪章教材,剩下的它自己跑完。

一个 Skill 就能做这么多事。但 Skill 真正的威力在下一步:组合。我手里不只有这一个 Skill——还有做深度网络调研的 Skill、把 Markdown 转 Word 的 Skill、做调研并生成笔记的 Skill、生成播客对话稿的 Skill、多阶段润色论文的 Skill、写公众号文章的 Skill,等等。每个 Skill 管一类任务,但它们真正强大之处在于可以排列组合:一章教材,用 lecture-generation 生成讲座音频,用播客 Skill 生成师生对话版本,用 Markdown 转 Word 输出讲义——同一份输入,三种输出,三个 Skill 各司其职。

这才是 Skill 的真正价值:不是单个操作手册有多强,而是你积累的操作手册越多,能覆盖的工作面就越大,能高质量全自动完成的工作项目就越丰富。

Skill 是上下文工程的产物

AI 的上下文窗口是有限的。你可以理解为它的工作记忆容量就那么大,塞太多信息进去反而会降低质量。那 Skill 是如何解决给 AI 的说明书长了以后导致的输出质量下降问题的?——靠渐进式加载(Progressive disclosure)。

想象你面前有一摞 20 本参考书。你不可能每次回答一个问题都把 20 本书从头读一遍。正常的做法是:先看目录和摘要判断哪几本可能有用,再翻到具体章节细读。

Skill 的三层结构就是这个逻辑:

第一层是文件头(YAML frontmatter),相当于摘要。只有几十个字,告诉 Claude 这个 Skill 叫什么名字、什么时候该用。Claude 每次对话开始时会快速扫描所有 Skill 的摘要,判断哪些跟当前任务相关。

第二层是 SKILL.md 的正文,相当于整本操作手册。只有在 Claude 判断当前任务需要这个 Skill 时,才会加载进来。

第三层是参考文件——放在 references、scripts、assets 等子文件夹里的详细材料。只有在执行过程中真正需要时才按需读取。

渐进式加载的设计让 AI 每个时刻都只处理最相关的信息,既省资源又保质量。这也是为什么 Anthropic 建议 SKILL.md 正文控制在 5000 词以内,长的参考材料拆到子文件夹里去。

这跟学术打工人有什么关系

说了这么多机制,回到核心问题:Skill 能帮我们做什么?

Skill在学术工作中的五大应用场景

第一个:文献综述流水线。 做过文献综述的人都知道,痛苦不在于找文献,而在于组织。你用 Zotero 管理了几百篇论文,但每次写综述还是要一篇篇翻、一条条整理、一个个比较。如果有一个 Skill 连接了你的 Zotero 库(通过 MCP),它知道你的分类体系(按方法分还是按主题分)、你习惯的比较维度(样本量、识别策略、主要发现、局限性),它可以按照你的框架自动生成文献比较表,标出哪些论文之间有矛盾结论,哪些空白区域还没有人做过。你的工作从写综述变成审综述。这里就是 Skill + MCP 的组合:MCP 负责连接 Zotero 读取文献数据,Skill 负责告诉 AI 该按什么框架来组织这些数据。

第二个:论文修改工作流。 收到审稿意见的那一刻,大多数人的第一反应是叹气。不是因为意见不好,而是因为接下来的工作量:逐条读意见、在原文中定位对应段落、改、写 response letter 解释改了什么。这套流程高度结构化。一个写好的 Skill 可以读入审稿意见,逐条定位原文相关段落,按你习惯的格式生成 response letter 初稿——先总结意见、再说修改方案、最后标注改在第几页第几行。你只管审核和修正。

第三个:课件制作与更新。 每学期更新课件是个苦差事。数据要更新到最新年份,案例要换成更时新的,但同时要保持符号一致(别上一页用 pp 下一页突然变成 PP)、叙事连贯。一个教学质量 Skill 可以检查整套课件的符号一致性、信息密度是否合理、新旧内容之间的过渡是否自然。Sant'Anna 的系统里就有一个审查员从 13 个维度评估幻灯片质量,这其实就是一个教学 Skill。

第四个:会议纪要与行政报告。 开完会写纪要,年底写总结,痛点都一样:格式固定但内容繁琐。每个学校、每个部门都有自己的模板,你得把内容填进特定格式里。一个行政报告 Skill 可以内置你所在机构的模板,自动追踪上次会议的待办事项,标记哪些已完成哪些还在进行。你只需要口述本次会议的要点,剩下的格式化和追踪工作交给它。

第五个:数据分析 pipeline。 做实证研究的人手里通常有一套编码规范:变量命名规则、缺失值处理方式、稳健性检查该做哪几种、表格用哪个期刊的格式。这些东西你可能有一份自己的备忘录,也可能只是存在脑子里。把它们写成 Skill,AI 每次跑回归时都会自动执行稳健性检查,生成的表格自动匹配你投稿的期刊格式,变量名遵循你的命名规范。

这五个场景有一个共同特点:重复性高、格式固定、质量标准明确。这正是 Skill 最能发挥价值的地方。不是让 AI 去做需要创造力和判断力的事——选题、假设构建、理论创新这些还是你的活——而是让它接手那些你已经知道怎么做、但每次做都很耗时间的结构化工作。

怎么开始

三条路径,你可以看看自己想最先尝试哪条。

路径一:从最烦的重复任务开始。 想想过去一个月里最让你头疼的活——改论文格式?写基金进展报告?整理会议纪要?把你平时给研究助理交代这件事时会说的话写下来,尽可能详细:分几步、每步做什么、什么算做好了、常见的坑有哪些。这就是你的第一个 Skill。技术上,创建一个文件夹,放一个 SKILL.md 文件,把这些内容用 Markdown 格式写进去。不需要特别的语法,就是你平时写备忘录的那种写法,加上分步骤的结构就够了。

路径二:用 Anthropic 的 skill-creator 技能辅助创建。 skill-creator 本身就是一个 Skill——一个专门用来创建其他 Skill 的元技能。装好之后,在 Claude 对话中直接说:

用 skill-creator 帮我创建一个技能。
目的:……
须包含以下步骤:
1……,
2……,
3……。
其中 X 步骤可使用 Y 工具。

它会引导你一步步定义用例、写描述、生成文件结构,相当于一个交互式的 Skill 搭建向导。官方说第一个 Skill 大概 15 到 30 分钟能搞定。

路径三:从现成的 Skill 改起。 Anthropic 在 GitHub 上开源了一批 Skill,包括生成 Word 文档、PPT、PDF 的。你可以 fork 一份,把里面的内容换成你自己领域的就行。地址见文末。

再说一次:写 Skill 不需要编程。

将工作的边际成本变为零

回到开头的话题。上篇文章的传播说明一件事:越来越多的学者开始意识到,Claude Code 这类工具不只是聊天机器人的升级版,而是一种新的工作方式。但从知道到用好,中间差的就是 Skill——把你的专业知识和质量标准写下来,让 AI 每次都按你的标准、根据你对学术的理解来做。

Sant'Anna 那套系统看起来复杂,底层逻辑其实很简单:给 AI 写操作手册。写得越详细、越结构化,AI 的输出就越接近你的标准。Skill 只是把这件事变成了一个标准化的格式和流程。

AI 本身够聪明,但聪明不等于好用——好用靠的是定制。对我们做研究和教学的人来说,每天面对的结构化任务——文献整理、格式转换、数据检查、报告撰写、课件维护——每一个都是 Skill 可以覆盖的场景。你不需要一口气搞一个完整的系统。从一个最让你头疼的重复任务开始,写一份操作手册,让 AI 按你的标准来。这就是第一步。

开始吧,沉淀下你多年积累的行业经验和专业判断,将以后每一次同类工作的边际成本变为零。

Source

  1. Anthropic - The Complete Guide to Building Skills for Claude (2026-01)
  2. GitHub: anthropics/skills
  3. Anthropic Blog: Skills Explained
related