从 Claude Code 的 Skills 设计中,我看到了 9 个值得借鉴的产品化思路
最近看到 Thariq 在 X 上发布的一篇长文《Lessons from Building Claude Code: How We Use Skills》,读完之后最大的感受不是“又多了一个 Agent 概念”,而是:Skills 正在从提示词技巧,进化成一种可复用、可组织、可分发的能力封装方式。
这篇文章并不只是介绍 Claude Code 怎么用 Skill,更重要的是,它把一个团队在真实生产环境里怎么沉淀经验、约束模型、复用流程、组织上下文,讲得很具体。
如果你在做 AI Agent、工作流自动化、企业知识库、内部开发平台,或者正在思考“如何把经验沉淀成 agent 能调用的能力”,这篇文章非常值得读。
为什么值得读这篇文章?
这篇文章有三个很高的价值:
- 它不是停留在“Skill 是什么”的概念层面,而是直接总结了团队里大量真实使用后的经验。
- 它把 Skills 从零散技巧整理成了较清晰的类别体系,方便团队内部建立共同语言。
- 它提醒我们:真正有价值的 Skill,不是重复常识,而是补上模型默认不知道的上下文、约束、脚本和坑点。
换句话说,这不是一篇“怎么写提示词”的文章,而更像一篇“怎么做 Agent 能力工程”的文章。
原文讲了什么?
作者先澄清了一个很常见的误解:很多人把 Skill 理解成“一个 markdown 文件”,但在 Claude Code 的语境里,Skill 更像是一个文件夹。
这个文件夹里不仅可以有说明文档,还可以包含:
- 脚本
- 资源文件
- 模板
- 数据
- references
- 配置项
- 动态 hooks
这意味着 Skill 的本质,不只是“告诉模型怎么做”,而是把完成某类任务所需的上下文和操作能力一起打包。
从这个角度看,Skill 更接近下面这几种东西的结合体:
- 一份 SOP
- 一组领域知识
- 一套可调用的辅助脚本
- 一种渐进式暴露上下文的方法
这也是为什么 Skills 会成为 Claude Code 中非常重要的扩展点。
一、作者总结的 9 类 Skills
文章里把团队内部常见的 Skills 大致分成了 9 类。这个分类很有启发性,因为它几乎覆盖了 Agent 在真实工作中最常见的几个方向。
1. Library & API Reference
这一类 Skill 的目标,是帮助模型正确使用某个库、CLI 或 SDK。
它特别适合用来处理下面这些问题:
- 某个内部 SDK 文档不完整
- 某个命令行工具参数很多,模型容易用错
- 某个前端设计系统有很多隐含约束
- 某个库有大量 footguns 和 edge cases
这类 Skill 的价值在于:把“会用”和“正确使用”之间的差距补齐。
2. Product Verification
这一类不是教模型写代码,而是教模型如何验证自己写出来的东西是否真的可用。
比如:
- 自动跑一遍注册流程
- 在结账链路里验证支付状态
- 借助 playwright、tmux 等工具进行交互式测试
这是非常重要的一类,因为很多 Agent 系统真正的短板,不是“不会生成”,而是“不会严谨验证”。
3. Data Fetching & Analysis
这一类 Skill 让 Agent 能够连接数据源、日志系统、监控面板和分析平台,完成更接近业务分析和运维排查的任务。
例如:
- 查询漏斗转化
- 对比 cohort 留存
- 根据问题快速定位 Grafana 看板
如果说前两类偏“工程执行”,这一类就开始进入“业务分析增强”。
4. Business Process & Team Automation
这一类非常像组织内部的自动化流程封装。
例如:
- 自动整理 standup
- 自动创建工单
- 生成 weekly recap
它的重点不在技术复杂度,而在于把团队重复做的事情,沉淀成标准化工作流。
5. Code Scaffolding & Templates
这类 Skill 用于生成样板代码、迁移模板、服务模板、项目初始化结构等。
它特别适合那些“并不复杂,但每次都很重复,而且要求风格统一”的工作。
本质上,这是把“脚手架”从传统代码模板,升级成“模板 + 说明 + 约束 + 上下文”的组合。
6. Code Quality & Review
这一类 Skill 用来提高代码质量,比如:
- 风格检查
- 测试规范约束
- 评审建议
- fresh-eyes 式的对抗性审查
它的意义不只是减少错误,更重要的是帮助团队把“隐性的代码标准”显性化。
7. CI/CD & Deployment
这一类关注的是交付流程,例如:
- 自动 babysit PR
- 部署后 smoke test
- 流量渐进发布
- 出问题自动回滚
这说明 Skill 不只是本地编码辅助,它也可以深入到工程交付链路。
8. Runbooks
这一类对 oncall、排障和 incident response 很有帮助。
它通常从一个症状出发,比如:
- 某类报警
- 某个错误签名
- 某个 Slack 讨论线程
然后引导 Agent 做结构化调查,最后生成报告。
这是典型的“把经验型排障流程封装成可以复用的能力”。
9. Infrastructure Operations
最后一类更接近基础设施和运维动作,比如:
- 找孤儿资源
- 做依赖治理
- 成本排查
- 带确认环节的清理操作
这一类 Skill 通常会涉及高风险动作,所以也特别需要 guardrails。
二、这篇文章最值得记住的 5 个判断
如果只能记住原文里的几条观点,我觉得下面 5 条最重要。
1. 不要写“显而易见的东西”
这是整篇文章里我最认同的一点。
模型本身已经知道很多通用知识。如果一个 Skill 只是把文档里最基础、最公开的内容又复述一遍,那它的边际价值会很低。
真正高信号的信息,通常来自下面这些内容:
- 团队内部默认约定
- 某个系统的特殊限制
- 某个库的常见坑
- 模型反复犯错的地方
- 某类任务里最容易忽略的细节
换句话说:Skill 的价值,不在“百科全书式覆盖”,而在“补模型的短板”。
2. Gotchas 往往是 Skill 里最值钱的部分
作者特别强调了 gotchas section。
这很合理,因为一个团队真正长期沉淀下来的经验,往往不是“应该怎么做”,而是:
- 哪些地方最容易踩坑
- 哪些做法看起来对,实际上会出错
- 哪些条件触发后必须换路径处理
如果你在构建内部 Skill,最有价值的维护方式之一,就是持续把模型和工程师踩过的坑写进去。
3. 要利用文件系统做“渐进披露”
这也是一个非常关键的设计思路。
Skill 不应该把所有信息一次性塞进一份大文档里,而应该利用目录结构,把不同信息放在不同层级:
- 主文档写原则和入口
- references 放详细 API 或签名
- assets 放模板
- scripts 放可调用脚本
- examples 放示例
这样模型可以在需要的时候按需读取,而不是一开始就被无差别信息淹没。
这其实是一种很典型的上下文工程思想。
4. 不要把模型“轨道化”得太死
原文提到,不要 railroading Claude。
也就是说,Skill 要提供足够的方向和边界,但不要把模型绑死在一种僵硬流程里。因为真实任务往往有上下文差异,如果写得过于死板,Skill 反而会降低适应性。
好的 Skill 更像:
- 给出判断原则
- 提供必要资料
- 提供常用脚本和模板
- 指出风险点
而不是:
- 要求每次都完全按固定路线机械执行
5. Description 字段不是简介,而是触发条件
这是很多人最容易忽视的一点。
作者提醒:模型会先扫描所有 Skill 的 description,再决定这次任务是否要触发某个 Skill。
所以 description 最重要的工作,不是“介绍这个 Skill 是什么”,而是清楚告诉模型:
- 什么情况下应该调用它
- 用户会怎么描述这类需求
- 哪些场景是它的适用边界
如果 description 写不好,再优秀的 Skill 也可能长期“躺在仓库里吃灰”。
三、为什么这篇文章对做 Agent 产品的人尤其重要?
因为它让我们看到,Agent 能力建设的重点,可能并不只是模型本身,而是:
- 如何组织上下文
- 如何把经验结构化
- 如何让模型按需读取信息
- 如何让工作流可复用
- 如何让验证与执行闭环起来
从这个角度看,Skill 并不是一个“Prompt 小技巧合集”,它更接近一种中间层:
把组织经验、工具能力、模板、验证方式、脚本和约束,封装成 agent 可以调用的能力单元。
这也是为什么很多团队在真正用 Agent 做事之后,最后拼的不是谁提示词更花哨,而是谁更早把知识和流程沉淀成可复用资产。
四、原文也隐含了几个更大的问题
虽然这篇文章已经很完整,但从评论区和实际应用角度看,还有几个问题会越来越重要。
1. Skill 的版本管理
如果多人在同一仓库中使用同名 Skill,但版本不同,结果可能会不一致。
这在团队协作和企业场景里会非常常见。
2. Skill 的去重与分类
当 Skill 越来越多时,重复、重叠、命名冲突会迅速增加。
例如:
- 一个团队有 design skill
- 另一个团队也有 design skill
- 还有外部社区版本的 design skill
这时候如何组织、推荐、治理,会成为核心问题。
3. Skill 的评估机制
我们怎么知道某个 Skill 更好?
是调用率更高?错误率更低?完成任务更快?用户满意度更高?
如果没有评估体系,团队就很难知道该继续维护什么、淘汰什么。
4. 面向社区的分发与商业化
原文更多是在讲内部使用视角,但如果 Skill 走向公共生态,就会出现新的问题:
- 如何发布
- 如何发现
- 如何安装更新
- 如何统计使用情况
- 如何沉淀贡献者生态
这会让 Skill 从“团队资产”进一步走向“平台能力”。
五、我自己的一个总结:Skill 的本质是什么?
读完整篇文章之后,我更愿意把 Skill 理解为下面这句话:
Skill 不是提示词包装,而是把组织经验产品化。
所谓“产品化”,不是说它一定要做成一个复杂平台,而是说它要具备几个特征:
- 能被触发
- 能被复用
- 能被维护
- 能被分发
- 能随着真实问题不断迭代
当一个团队开始认真构建 Skills,它其实是在把原本散落在文档、聊天记录、资深员工脑子里、脚本角落里的经验,整理成 agent 时代可以真正被消费的能力层。
这件事的意义,比单纯“让 AI 更聪明一点”要大得多。
总结
如果你正在搭建自己的 Agent 工作流,我觉得这篇文章最值得带走的,不只是那 9 类 Skill,而是背后的方法论:
- 不要重复模型已经知道的内容
- 要优先沉淀 gotchas 和高信号经验
- 用文件系统做渐进披露
- 给模型边界,但不要把它写死
- 把 description 当成触发机制来设计
等你真正开始这样做,你会发现自己做的已经不只是“提示词工程”,而是更接近一套可演化的 agent 能力体系。
文章来源与出处
本文基于以下原文进行整理、翻译与延伸解读:
- Thariq, “Lessons from Building Claude Code: How We Use Skills”
- 原始链接:https://x.com/trq212/status/2033949937936085378
- 文中观点与结构整理自作者原文,中文表达、结构化梳理与延伸分析为本文作者补充
如果你更关心的是“这些经验能不能迁移到别的 Agent 平台”,答案大概率是:可以,而且非常值得。 因为它本质上讨论的不是某个单一产品功能,而是“如何把经验转化为 agent 可用能力”这件事本身。