✍️ 公众号文章

研究者

AI 教师

经/管/金融人

我是如何用 Claude Code 的

作者分享半年使用 Claude Code 的体会：以 TODO+Loop 让 AI 自主执行任务，搭建 CLAUDE.md、Skills、并行子代理等基础设施，强调容错协作、规划与边界约束，认为用好 AI 是一种管理能力。

李学恒2026年4月12日7 分钟阅读#claude-code#ai-workflow#multi-agent#todo-loop#skills

目录展开 ↓

我的核心玩法：写个清单，让它自己干
它干了什么：远不止写代码
翻车是常态
那个按门铃的故事
基础设施
关系
半年下来的几点感受
最后

我用 Claude Code 大概有半年了。最近跑了一次它自带的使用分析（Insights），看到一组数字：191 个会话，2821 次命令调用，602 次子代理调度，191 次 git 提交。盯着这些数字看了一会儿，我意识到一件事——我早就不把它当聊天助手了。

它更像我团队里的一个初级成员。我给方向，它来执行。做得好就继续，跑偏了就拽回来。

这篇文章不是教程，就是聊聊我自己怎么用的，用下来什么感受。

我的核心玩法：写个清单，让它自己干

如果只能用一句话概括我怎么用 Claude Code，那就是：我写 TODO，它来执行。

操作很简单。我把一个项目拆成一串任务，写在 TODO.md 里。然后启动一个叫 Loop 的循环模式，给一句提示词："读 TODO，找到第一个没完成的任务，执行，标记完成，提交代码，然后找下一个。"

接下来我就去干别的事了。

Claude 会一个任务接一个任务地推进，每做完一个自动 commit 一次。有时候回来一看，十几个任务全绿了，git log 里整整齐齐排着一串提交记录，像一个勤恳的实习生交上来的作业本。

这个模式我跑过最长的一次是 5 个小时。一个 Stripe 支付集成项目，从创建配置、安装依赖、搭建产品页面，一直到部署上线，7 个阶段全部自主完成。中间我大概看了两三次进度，没怎么干预。

说实话，第一次跑通的时候挺震撼的。不是因为它写的代码有多好——中间当然有 bug，后面会说到——而是这种 "交代完就不用管" 的体验，在以前是不存在的。以前用 ChatGPT 那种对话模式，每说一句都得等回复，看完再决定下一步，整个过程是你推着它走。现在反过来了，是它自己在走，你只需要偶尔抬头看一眼方向对不对。

它干了什么：远不止写代码

"Claude Code"这个名字有点误导——让人以为它只是个编程工具。我的实际使用里，写代码大概只占三分之一，剩下的全是别的东西。

最密集的一段时间，我在做一个 AI 培训工作坊的材料。Marp 幻灯片、案例库、练习题、讲义——一整套东西。这些内容不适合手工一点一点打磨，因为每改一处措辞，相关的好几个地方都要跟着调整。我就把它设计成了一个 20 轮的自动化流水线：先生成骨架，然后进入 "生成—审稿—修订" 的循环，每一轮自动优化上一轮的问题。20 轮跑完，一整套材料就出来了。

学术写作那边更有意思。有一次我想研究一下顶级经济学家的写作风格，就让 Claude 去下载 Raj Chetty 的 19 篇发表论文，全部转成 Markdown，逐篇分析段落结构、论证模式、过渡词使用习惯，最后合成了一份完整的风格画像。这个画像后来我真的拿来指导自己写论文了——比自己模糊地"多读好论文"有效得多，因为它把风格拆解成了可操作的具体特征。

论文修订也是个高频场景。我有一篇文章在走审稿流程，需要对审稿意见逐条回应。我开了一个会话，派出多个并行子代理——一个分析引言结构，一个提取实验数据做一致性检查，一个对比审稿人提到的参考文献——最后汇总成修改方案。一个会话下来，8 次提交，效率非常高。

还有叙事 Wiki、技术博客、iOS 应用发布、课程网站搭建……项目类型跨度大到我自己都有点意外。回过头看，Claude Code 的能力边界其实不在于它会什么语言或框架，而在于 你愿不愿意花时间把任务拆清楚。只要任务描述足够明确，它几乎什么都能接。

翻车是常态

讲了这么多好听的，该说说翻车了。

Insights 报告里有一个数字让我印象很深：54 次 "方向错误" 事件。什么意思呢？就是 Claude 理解错了我的意图，往错误的方向跑了。

举几个典型的场景。

有一次我只是让它更新 TODO.md 里的任务状态——把某个任务标记为完成。结果它不光改了状态，还自己开始写代码实现下一个任务了，甚至在改 TODO 文件的过程中不小心删掉了文件里的一段工作流规则。我当时的反应大概就是：兄弟，我让你打个勾，没让你动手术。

还有一次修 CSS。一个很小的样式问题，它改了一版不行，又改一版还不行，来来回回试了好几轮。最关键的是，每改一次它就让我去浏览器里刷新检查——拜托，你是有终端的，你自己跑测试看效果啊。最后我忍不住说了一句："自己调试，不要每次都让我检查。"它立刻就学乖了，后面开始自己验证了。

29 次代码 bug，6 次过度修改。这些数字单看挺吓人的，但放在 191 个会话的总量里，其实就是百分之十几的出错率。而且关键是：几乎所有任务最终都完成了。70 次完全达成，只有 2 次没做成。

我后来想明白了一个道理：和 AI 协作，追求零失误是不现实的，也没必要。更好的策略是 接受它会犯错，然后在下一轮快速修正。就像带一个能力尚可但经验不足的新人，你不会期待他每一步都完美，但你会要求他能纠正、能迭代。

我把这种方式叫 "容错式协作"。不写滴水不漏的指令，而是给一个大方向，让它先跑起来，出了问题再纠偏。整体效率比事无巨细地写 prompt 高得多。

那个按门铃的故事

说一个最离谱的翻车。

有一次 Loop 在执行任务清单，所有任务都完成了。正常来说，它应该输出 "DONE" 然后停下来。但不知道哪里出了问题，它没停。

"检查 TODO.md，所有任务均已完成，没有待办事项。"

然后它又检查了一遍。

"检查 TODO.md，所有任务均已完成，没有待办事项。"

又来。

"检查 TODO.md，所有任务均已完成，没有待办事项。"

同一句话重复输出了大约 100 遍，直到我手动按了 Ctrl+C 终止。就像一个快递员按门铃按了一百下，所有人都下班了他还在按——非常敬业，但也非常傻。

这件事让我笑了很久，但也让我开始认真思考 Loop 的终止条件问题。后来我给 Loop 加了更明确的退出逻辑，也开始考虑用 Headless Mode 替代简单的 Loop，用脚本来控制执行流程。

工具的边界，往往是在这种荒诞的时刻才看得最清楚。

我搭了一整套"基础设施"

半年用下来，我围绕 Claude Code 搭建了一整套基础设施。这些东西的投入成本不低——有些 Skill 我花了二十多个小时才调通——但回报也很可观，因为它们每天都在省时间。

CLAUDE.md 是最基础的一层。每个项目根目录放一个，告诉 Claude 这个项目的背景、文件结构、写作风格、做事规矩。就像给新员工的入职手册，读完它就知道在这个项目里该怎么干活。我的全局 CLAUDE.md 已经迭代了很多版，核心原则是"少即是多"——只放每次会话都要用的规则，低频的东西封装到 Skill 里。

Skills 是第二层。把高频工作流封装成一个个可复用的模块，Claude 能根据任务自动识别该用哪个。比如我有一个中文引号转换的 Skill，有一个笔记归档的 Skill，有一个论文修订的 Skill。每个 Skill 背后是一套完整的处理逻辑和质量标准，但对我来说只需要一句话就能触发。

并行子代理 是最让我兴奋的部分。复杂任务不一定要串行做，很多时候可以同时派出好几个 Agent，各管一摊，最后汇总。论文修订的时候，我同时派出了 11 个文档处理代理，这在传统工作流里完全不可想象。

这些基础设施叠加起来的效果是：Claude Code 不再是一个 "我打开来用" 的工具，而是整个工作环境的一部分。它嵌在我的编辑器里、连着我的文件系统、读着我的项目文档、按着我设定的规则干活。这种感觉和打开一个网页聊天框完全不同。

我和 Claude Code 的"关系"

用了半年之后，如果有人问我和 Claude Code 是什么关系，我会说：它是我团队里最勤奋但最需要管理的那个人。

勤奋体现在：给它活它就干，不抱怨不拖延，24 小时随叫随到，遇到问题会自己尝试解决（虽然有时候越解决越乱）。

需要管理体现在：它经常理解偏你的意思，有时候好心办坏事，偶尔会在不该发挥的地方过度发挥。你不能完全放手不管，但也不能事事盯着——最佳状态是一种 松紧适度的信任。

我很少中途打断它——191 个会话里只有 2 次直接中断。大部分时候我选择让它先做完，做错了再纠。这跟我在学校带学生的方式有点像：给一个方向，让他们先试，犯了错一起复盘，比你手把手教的效果好。

当然，这种方式的前提是你能承受错误的成本。如果是生产环境的关键代码，我不会这么放手；但对于内容生产、文档写作、原型开发这类场景，试错成本很低，自主执行的效率优势就很明显了。

半年下来的几点感受

第一，规划是人的活，执行是 AI 的活。 把一个大目标拆成清晰的任务列表，这件事目前还是人做更靠谱。但列表一旦拆好，逐个执行这件事，AI 比人快很多，也更不容易分心。

第二，约束边界比详细指令更有效。 与其告诉 Claude 每一步怎么做，不如告诉它 "只做这个，不要碰那个"。我吃过很多次亏之后发现，限定范围比规定动作省事得多。

第三，基础设施投入值得。 前期花时间搭 CLAUDE.md、写 Skill、调 Hook，后面每次使用都在吃红利。这是一个很典型的边际成本递减的事情，经济学家不需要别人来解释这个道理。

第四，用 AI 是一种管理能力。 这一点我越来越确信。用好 AI 和用好团队需要的能力是高度重叠的：能拆任务、能定标准、能容错、能给有效反馈、知道什么时候该介入什么时候该放手。反过来说，如果一个人管理能力本身就弱，给他再好的 AI 工具也用不出效果来。

第五，AI 改变的不是你做什么，而是你做事的方式。 我还是在写论文、做课件、搭网站、管笔记——做的事没变。变的是 我花多少时间在执行层面，花多少时间在思考层面。以前写一份材料，60% 的时间在打字排版，40% 在构思内容。现在反过来了，80% 的时间在想清楚要什么、怎么拆，20% 的时间在审核 AI 的产出。

这种比例的变化，日积月累下来，影响是很大的。

最后

有人可能会觉得，一个经济学教授为什么要花这么多时间折腾 AI 工具。我的回答是：这和研究方向无关，和工作效率有关。任何需要大量文本处理、项目管理、内容生产的工作，都能从这种人机协作模式里获益。

更深一层说，我觉得 理解 AI 怎么工作、怎么用好 AI，本身就是这个时代的一项基本素养。不管你是做学术、做产品还是做教育，和 AI 协作的能力会越来越决定你的产出上限。

我不觉得我的用法有多了不起——191 个会话里有 40 次不满意和 5 次沮丧呢。但这半年确实让我体会到了一种新的工作节奏：想清楚，交出去，盯结果，快纠偏。

如果你也在用 Claude Code，可以跑一次 Insights 看看自己的使用画像。也许你会像我一样，从数据里发现一些自己没意识到的使用习惯。

李学恒，中山大学岭南学院

我是如何用 Claude Code 的

我的核心玩法：写个清单，让它自己干

它干了什么：远不止写代码

翻车是常态

那个按门铃的故事

我搭了一整套"基础设施"

我和 Claude Code 的"关系"

半年下来的几点感受

最后

LLM记忆管理三层架构

高效使用 Claude Code 心得

Claude Code Skills：让AI更懂你的魔法配方

相关阅读

LLM记忆管理三层架构

高效使用 Claude Code 心得

Claude Code Skills：让AI更懂你的魔法配方

相关标签