hoangCreative/skill-upgrade
GitHub: hoangCreative/skill-upgrade
一套将 AI 行为类 skill 从「勉强能用」提升到发布级质量的分阶段流程框架,源自一次真实的 Claude skill 升级实践。
Stars: 0 | Forks: 0
# skill-upgrade
我原本有一个运行良好的 skill。在大多数情况下它都能胜任工作,当时的诱惑仅仅是
润色一下文字,提升一下版本号,然后称之为“升级”。后来,我把它交给了一群
专门负责挑错的 agent 进行测试,结果我眼睁睁看着它令人信服地履行了
自身的规则,报告自己已达标,但最终依然违背了自己的
准则。那天我才明白,“让它更好看”并不等于升级。
真正的升级,始于指出 skill 崩溃的地方。
这是一个将那个 skill 从“勉强能用”提升至“发布级”乃至更高级别的过程,
我将其记录下来,是为了让它能适用于任何行为类的 skill,而不仅仅是
它最初来源的那个。
## 贯穿始终的两条规则
1. **升级需要一个明确的目的。** 不要为了粉饰而升级。指出当前
版本错在哪里、谁会受到损害,以及一个“让陌生人也能直接用”的
版本能带来什么。没有明确指出的缺陷,就不算升级。
2. **亲口尝尝自己的狗粮。** 整个过程必须遵循它所升级的 skill 的
准则。要硬化一个验证类的 skill?那么升级过程中的每一项主张
本身也必须有理有据或被明确标记为未经验证。一个如果连应用到
自身的升级过程都撑不过去的 skill,就还没成型。
## 首先,对 skill 进行分类
在进行任何步骤之前,先对 skill 进行分类:reflex(反射型)、module(模块型)或 engine(引擎型)。这个类别决定了
流程的繁重程度,这样就不会把一个四十行的 reflex skill 强行塞进
与完整的 engine 相同的 pipeline 中。reflex skill 可以跳过正式的测试
库和贡献基础设施;而 engine 则需要全套配置。不要构建
skill 根本用不到的繁杂流程。
## 七个步骤(步骤 5 至 7 仅在向他人发布时需要)
1. **在落笔前明确缺陷规范,锁定架构。**
2. **大规模压力测试**,召集一个旨在破坏它的 adversarial council(对抗委员会),
然后划定明确的边界:CUT(删减)、KEEP(保留)、FIX(修复)、ADD(新增)。
3. **重写并扎根于真实的现有成果,优先参考社区资源**,绝不依赖记忆。
将方法论写成带有引用说明的故事,包括它曾经失效的地方。
4. **将通用引擎与受上下文绑定的部分分离开来**,这样特定文化或
领域的内容就不会占据规范化的核心位置。
5. **规范化测试 apparatus**:提供别人也能运行的 fixtures、固定的
regression bank(回归测试库),以及一份简短的 tests README。
6. **构建无需守门人也能维持高标准的贡献基础设施**:
一套强制执行标准的评估准则,以及强制执行机械规则的 CI。
7. **审计、版本控制、打包。** 发布与否由作者亲自把关。
完整的分步指南(每一步背后的详细示例)都在 `SKILL.md` 中。
## 超越 100%
达到基准线只需前七个步骤。想要超越它,还需要最后一步:找出
基准 skill 做不到而当前 skill 可以做到的事,然后实现它。最强大的
版本是这样一个 skill:它会明确指出自己的能力天花板,说明文字描述的
局限性,并为突破上限设计好对应的 harness(测试套件)。
## 适用边界
这是一个流程,而不是保证。它能让一个 skill 变得诚实且可复现;
但它无法让一个糟糕的想法变得有价值,而且如果你
跳过了某个步骤,它也无法自我执行。这种准则的效果完全取决于
执行者的用心程度,这就是为什么会有规则二的存在:这个流程本身也必须
能够经受住应用于自身的考验。它是从一次真实的升级中
提炼出来的,所以当你在自己的 skill 上运行它时,它会暴露出
这七个步骤未能预见到的失败。这正是流程在发挥作用,而不是
流程失效了。
## 不适用场景
如果 skill 没有明确指出缺陷,或者只是一个需要简单编辑就能搞定的琐碎修复,
而非一套流程,就不要运行它。这七个步骤是针对真正的版本跃升的。
## 安装
```
cp -R skill-upgrade ~/.claude/skills/
```
重新加载你的 assistant。`name` 字段将作为触发器。
## 作者
Le Cong Hoang (LCH)。采用 Apache-2.0 许可,详见 `LICENSE`。提炼自
what-for-and-how 从 v2 到 v3.1 的升级过程。
标签:AI智能体, DLL 劫持, 人工智能, 大语言模型, 开发流程, 用户模式Hook绕过, 防御加固