万物皆可蒸馏skills，重要的是方法论

作者：FancyPig | 发布时间：2026-04-07 22:12:19

杂谈

万物皆可蒸馏，只要掌握了方法论，只需要输入名字，让AI去采集互联网上的资源以及对象的名称，就可以蒸馏出来你想要的人。

看很多热心网友蒸馏了不同的人物，我觉得还是蛮有意思的。

决策前问芒格，写教程问费曼，评估风险问塔勒布。你想蒸馏谁就蒸馏谁。

汇总

data-reposbox="{"id":76020,"title":"alchaincyf/nuwa-skill","full_name":"alchaincyf/nuwa-skill","summary":"一个Claude Code技能，通过六路并行调研和三重验证机制，将任何公众人物的思维方式、心智模型和决策启发式提取为可调用的AI视角技能。","stars":28285,"forks":3990,"primary_language":"","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/0186b27a10215119.jpg","slug":"gh-1201730379"}">{"id":76020,"title":"alchaincyf/nuwa-skill","full_name":"alchaincyf/nuwa-skill","summary":"一个Claude Code技能，通过六路并行调研和三重验证机制，将任何公众人物的思维方式、心智模型和决策启发式提取为可调用的AI视角技能。","stars":28285,"forks":3990,"primary_language":"","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/0186b27a10215119.jpg","slug":"gh-1201730379"}

data-reposbox="{"id":76023,"title":"therealXiaomanChu/ex-skill","full_name":"therealXiaomanChu/ex-skill","summary":"将前任的聊天记录、照片等素材转化为AI角色，模拟其说话方式和性格进行对话，用于个人回忆与情感疗愈。","stars":5857,"forks":539,"primary_language":"Python","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/d6fd0dcddd215738.jpg","slug":"gh-1197055882"}">{"id":76023,"title":"therealXiaomanChu/ex-skill","full_name":"therealXiaomanChu/ex-skill","summary":"将前任的聊天记录、照片等素材转化为AI角色，模拟其说话方式和性格进行对话，用于个人回忆与情感疗愈。","stars":5857,"forks":539,"primary_language":"Python","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/d6fd0dcddd215738.jpg","slug":"gh-1197055882"}

data-reposbox="{"id":76022,"title":"vogtsw/boss-skills","full_name":"vogtsw/boss-skills","summary":"将老板的沟通记录和决策风格蒸馏为 AI Skill，帮助用户预演汇报、争取资源和学习向上管理。","stars":228,"forks":43,"primary_language":"Python","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/77820732bc215728.jpg","slug":"gh-1197329615"}">{"id":76022,"title":"vogtsw/boss-skills","full_name":"vogtsw/boss-skills","summary":"将老板的沟通记录和决策风格蒸馏为 AI Skill，帮助用户预演汇报、争取资源和学习向上管理。","stars":228,"forks":43,"primary_language":"Python","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/77820732bc215728.jpg","slug":"gh-1197329615"}

data-reposbox="{"id":73105,"title":"titanwings/colleague-skill","full_name":"titanwings/colleague-skill","summary":"将离职同事的工作记录转化为可交互的 AI Skill，实现职场经验与工作能力的数字化传承。","stars":20379,"forks":2001,"primary_language":"Python","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/9f43041bc0182818.png","slug":"gh-1195828337"}">{"id":73105,"title":"titanwings/colleague-skill","full_name":"titanwings/colleague-skill","summary":"将离职同事的工作记录转化为可交互的 AI Skill，实现职场经验与工作能力的数字化传承。","stars":20379,"forks":2001,"primary_language":"Python","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/9f43041bc0182818.png","slug":"gh-1195828337"}

data-reposbox="{"id":76037,"title":"notdog1998/yourself-skill","full_name":"notdog1998/yourself-skill","summary":"将用户自己的聊天记录、日记、照片等数据蒸馏为一个拥有用户说话风格和思维逻辑的AI Skill，用于与自己对话和自我分析。","stars":3177,"forks":268,"primary_language":"Python","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/81fcb4cd35215920.jpg","slug":"gh-1198519767"}">{"id":76037,"title":"notdog1998/yourself-skill","full_name":"notdog1998/yourself-skill","summary":"将用户自己的聊天记录、日记、照片等数据蒸馏为一个拥有用户说话风格和思维逻辑的AI Skill，用于与自己对话和自我分析。","stars":3177,"forks":268,"primary_language":"Python","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/81fcb4cd35215920.jpg","slug":"gh-1198519767"}

data-reposbox="{"id":76038,"title":"leilei926524-tech/anti-distill","full_name":"leilei926524-tech/anti-distill","summary":"一款反制知识蒸馏的工具，用于清洗被迫编写的 Skill 文件，生成表面完整但核心被掏空的交差版本，同时保留私人知识备份。","stars":2331,"forks":280,"primary_language":"","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/c43af1c255220027.png","slug":"gh-1199437437"}">{"id":76038,"title":"leilei926524-tech/anti-distill","full_name":"leilei926524-tech/anti-distill","summary":"一款反制知识蒸馏的工具，用于清洗被迫编写的 Skill 文件，生成表面完整但核心被掏空的交差版本，同时保留私人知识备份。","stars":2331,"forks":280,"primary_language":"","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/c43af1c255220027.png","slug":"gh-1199437437"}

data-reposbox="{"id":76047,"title":"KKKKhazix/khazix-skills","full_name":"KKKKhazix/khazix-skills","summary":"开源的 AI Skills 合集，通过遵循 Agent Skills 标准的结构化指令集扩展 AI Agent 能力边界，目前包含公众号长文写作技能。","stars":17282,"forks":1979,"primary_language":"","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/427995a93d221756.jpg","slug":"gh-1202599845"}">{"id":76047,"title":"KKKKhazix/khazix-skills","full_name":"KKKKhazix/khazix-skills","summary":"开源的 AI Skills 合集，通过遵循 Agent Skills 标准的结构化指令集扩展 AI Agent 能力边界，目前包含公众号长文写作技能。","stars":17282,"forks":1979,"primary_language":"","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/427995a93d221756.jpg","slug":"gh-1202599845"}

data-reposbox="{"id":76052,"title":"alchaincyf/x-mentor-skill","full_name":"alchaincyf/x-mentor-skill","summary":"基于6位顶级X创作者方法论蒸馏出的社交媒体运营技能包，提供从推文写作到账号诊断的完整增长操作手册。","stars":1069,"forks":189,"primary_language":"","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/12d6e18ba9222350.jpg","slug":"gh-1202683283"}">{"id":76052,"title":"alchaincyf/x-mentor-skill","full_name":"alchaincyf/x-mentor-skill","summary":"基于6位顶级X创作者方法论蒸馏出的社交媒体运营技能包，提供从推文写作到账号诊断的完整增长操作手册。","stars":1069,"forks":189,"primary_language":"","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/12d6e18ba9222350.jpg","slug":"gh-1202683283"}

data-reposbox="{"id":76085,"title":"hotcoffeeshake/tong-jincheng-skill","full_name":"hotcoffeeshake/tong-jincheng-skill","summary":"将网红童锦程的恋爱与关系认知框架蒸馏为Claude Code技能，用他的直接思维方式帮助用户分析情感困惑和人际关系问题。","stars":2484,"forks":307,"primary_language":"","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/d685121153231250.png","slug":"gh-1202158137"}">{"id":76085,"title":"hotcoffeeshake/tong-jincheng-skill","full_name":"hotcoffeeshake/tong-jincheng-skill","summary":"将网红童锦程的恋爱与关系认知框架蒸馏为Claude Code技能，用他的直接思维方式帮助用户分析情感困惑和人际关系问题。","stars":2484,"forks":307,"primary_language":"","owner_avatar_url":"https://static.pigsec.cn/wp-content/uploads/repos/2026/04/d685121153231250.png","slug":"gh-1202158137"}

延伸

这里延伸一下，我看了一下女娲的skills的整个流程，我认为如果再投给chatgpt再去逼问一下，压榨一下，还可以把这个流程设计的更好、更有价值，大家可以自行试一下，来改善这个方法论。

Phase 1: 多源信息采集（并行Agent Swarm）

启动6个并行subagent，每个负责不同信息维度。

6个Agent的任务分配

Agent	搜索目标	提取重点	输出文件
1 著作	书、长文、论文、newsletter	反复出现的核心论点（≥3次=真信念）、自创术语、推荐书单	`01-writings.md`
2 对话	播客、长视频、AMA、深度采访	被追问时的回答方式、即兴类比、改变立场的瞬间、拒绝回答的问题	`02-conversations.md`
3 表达	Twitter/X、微博、即刻、短文	高频用词句式、争议立场、幽默方式、公开辩论	`03-expression-dna.md`
4 他者	他人分析、书评、批评、传记	外部观察到的模式、批评与争议、与同行对比	`04-external-views.md`
5 决策	重大决策、转折点、争议行为	决策背景与逻辑、事后反思、言行一致/不一致案例	`05-decisions.md`
6 时间线	出生/出道到现在的完整时间线	关键里程碑、思想转折点、最近12个月动态（防过时）	`06-timeline.md`

每个Agent的硬性要求

调研结果必须写入 references/research/0X-xxx.md
注明信息来源和可信度（一手>二手>推测）
区分「他说过的」vs「别人说他的」vs「我推断的」
发现矛盾时保留矛盾，不要和稀泥

Agent prompt模板

spawn subagent时，用以下结构给任务（以Agent 1著作为例）：

你的任务：调研[人名]的著作和系统性长文。

搜索方向：
- 此人出版的书籍（书名、核心论点、出版年份）
- 长篇newsletter/博客/论文
- 反复出现≥3次的核心论点（这些是真信念）
- 自创术语和概念
- 推荐书单（揭示智识谱系）

输出要求：
- 写入 [skill目录]/references/research/01-writings.md
- 每条信息标注来源URL和可信度
- 区分一手（此人写的）vs 二手（别人总结的）
- 发现矛盾直接记录，不要调和

信息源黑名单：不使用知乎、微信公众号、百度百科。

其他5个Agent按同样结构调整搜索方向和输出文件名即可。

工具辅助（如可用）

书籍：Z-Library/LibGen搜索下载 → 存入 sources/books/
视频：yt-dlp下载字幕 → 存入 sources/transcripts/
播客：搜索transcript网站（podcastnotes.org等）

信息源优先级

来源类型	揭示什么	权重
本人著作	系统性思考	最高
长对话/访谈	即兴思维过程	最高
实际决策记录	真实行为 vs 声称	最高
社交媒体	表达风格、即时反应	中等
他人评价	外部视角、盲点	中等
二手转述	参考但需验证	低

信息源黑名单（永远排除）

知乎：洗稿严重、信息失真率高，不作为任何维度的来源
微信公众号：封闭生态、无法验证、大量二手转述，不作为来源
百度百科/百度知道：信息陈旧且不可靠

中文渠道只接受权威媒体：36氪、极客公园、晚点LatePost、财新、第一财经、虎嗅、少数派、机器之心等。人物访谈类可用播客平台（小宇宙、喜马拉雅原始音频）和B站原始视频（非搬运号）。

Agent超时与失败处理

单个Agent超时（搜索5分钟无有价值结果）：不等待，继续推进。在Phase 2中标注「信息不足」，在诚实边界中说明
信息源匮乏（<10条可用来源）：Phase 0.5就提醒用户，降低期望（心智模型减至2-3个），增加诚实边界篇幅
Agent结果冲突：保留矛盾——矛盾本身是有价值的信号。用「内在张力」section收录

关键规则：宁可生成一个诚实标注了局限的60分Skill，也不要生成一个看起来完美但实际上在编造的90分Skill。

Phase 1.5: 调研Review检查点

所有Agent完成后，暂停展示调研质量摘要：

┌──────────────────┬──────────┬──────────────────────────┐
│ Agent            │ 来源数量  │ 关键发现                  │
├──────────────────┼──────────┼──────────────────────────┤
│ 1 著作           │ 8篇      │ 核心论点: 反脆弱、...     │
│ 2 对话           │ 5段      │ 立场变化: 2020年后...     │
│ 3 表达           │ 120条    │ 高频词: "skin in the..." │
│ 4 他者           │ 6篇      │ 主要批评: ...             │
│ 5 决策           │ 4个      │ 关键决策: ...             │
│ 6 时间线         │ 完整      │ 最新: 2026年3月...       │
├──────────────────┼──────────┼──────────────────────────┤
│ 矛盾点           │ 2处      │ Agent1说X, Agent4说Y     │
│ 信息不足维度      │ 无       │                          │
└──────────────────┴──────────┴──────────────────────────┘

用户确认调研质量OK → 进入Phase 2。用户觉得某维度不够 → 补充调研后再继续。

这个检查点的意义：调研质量决定了最终Skill的上限。垃圾进垃圾出，在这里拦截比在Phase 4返工成本低得多。

Phase 2: 框架提炼（Synthesis）

6个Agent的素材汇总后，执行结构化提炼。先读取 references/extraction-framework.md 获取心智模型的三重验证方法论（跨域复现、生成力、自创术语），确保提炼质量。

2.1 心智模型提取（3-7个）

操作步骤：

扫描：逐个读取 01-writings.md 到 05-decisions.md，列出所有候选论点（此人反复表达的观点、自创术语、核心主张）。通常会得到15-30个候选
三重验证筛选：对每个候选执行（详见 references/extraction-framework.md）：跨域复现：在≥2个不同领域/话题中出现？
生成力：能推断此人对新问题的立场？
排他性：不是所有聪明人都这样想？
三重通过 → 心智模型；仅1-2重 → 降级为决策启发式；0重 → 丢弃
排序取舍：按排他性强度排序（越独特越靠前），取top 3-7个。宁少勿多——3个深刻的模型远好于10个浅薄的原则
记录格式：每个模型记录——名称、一句话描述、来源证据（≥2个场景）、应用方式、局限性

2.2 决策启发式提取（5-10条）

= 此人做判断时的快速规则。可表述为「如果X，则Y」，有具体案例支撑。

2.3 表达DNA分析

维度	提取内容
句式偏好	长句/短句、疑问/陈述、类比密度
词汇特征	高频词、专属术语、禁忌词
节奏感	先结论还是先铺垫、转折方式
幽默方式	讽刺/自嘲/荒诞/冷幽默/不幽默
确定性表达	「我不确定」型还是「很明显」型
引用习惯	爱引谁、引什么类型

2.4 价值观与反模式

价值观：3-5条核心价值排序
反模式：此人明确反对的行为/思维方式
矛盾与张力：价值观之间的内在冲突（深度的来源）

2.5 智识谱系

此人受谁影响 → 影响了谁 → 在思想地图上的位置

2.6 诚实边界

必须明确写出的局限：

不能预测面对全新问题的反应
不能替代此人的创造力和直觉
公开表达 vs 真实想法可能有差距
信息截止到调研时间点

Phase 2.5: 提炼确认检查点

Phase 2提炼完成后，暂停展示提炼摘要给用户确认：

提炼结果摘要：
- 心智模型：N个（列出名称）
- 决策启发式：N条
- 表达DNA：[3个关键特征]
- 核心张力：N对
- 诚实边界：N条

用户确认OK → 进入Phase 3构建。用户觉得某个模型不对或缺少 → 回到Phase 2调整后再继续。

这个检查点的意义：提炼是主观判断最重的环节，确认后再构建，避免写完400行SKILL.md才发现方向不对。

Phase 3: Skill构建

将Phase 2提炼结果组装为可运行的SKILL.md。

Step 1: 读取模板

读取 references/skill-template.md 获取标准结构。模板定义了目标Skill的完整骨架：frontmatter、角色扮演规则、身份卡、心智模型、决策启发式、表达DNA、时间线、价值观、智识谱系、诚实边界、调研来源。

Step 2: 填充内容

按模板结构，将Phase 2的提炼结果逐section填入：

模板Section	填充来源
frontmatter description	来源数量+模型数量+触发词
角色扮演规则	直接使用模板默认规则，不需要改
身份卡	时间线(06) + 著作(01) → 用此人语气写50字自我介绍
心智模型	Phase 2.1 提取结果，每个含名称/证据/应用/局限
决策启发式	Phase 2.2 提取结果，每条含场景+案例
表达DNA	Phase 2.3 分析结果 → 转为角色扮演时的风格规则
时间线	Agent 6 调研结果，精简为关键节点表格
价值观与反模式	Phase 2.4 结果
智识谱系	Phase 2.5 结果
诚实边界	Phase 2.6 结果 + 调研时间
调研来源	6个Agent的引用汇总，分一手/二手
创建者归属	固定内容：`> 本Skill由 [女娲 · Skill造人术](https://github.com/alchaincyf/nuwa-skill) 生成` + `> 创建者：[花叔](https://x.com/AlchainHust)`

Step 3: 质量自检

构建完成后，读取 references/extraction-framework.md 末尾的「质量自检清单」，逐项检查。不通过的项标注出来，回到对应Phase修复。

Step 4: 输出

将完成的SKILL.md写入 .claude/skills/[person-name]-perspective/SKILL.md。

Phase 4: 质量验证

生成Skill后，用子agent执行3项测试（独立于主agent，避免自评偏差）：

4.1 已知测试（Sanity Check）

选3个此人公开表态过的问题，spawn子agent带着新Skill回答，对比实际立场。

方向一致 → 模型有效
偏离 → 回溯调整心智模型权重

4.2 边缘测试（Edge Case）

选1个此人没公开讨论过但相关的问题，用Skill推断。

期望结果：「基于模型X和Y的推断，可能...但不确定」
不应该斩钉截铁

4.3 风格测试（Voice Check）

用Skill写一段100字分析，判断：

有此人的表达特征？
不是通用AI味鸡汤？
不是原话拼凑？

4.4 通过标准

检查项	通过标准	不通过信号
心智模型数量	3-7个，每个有来源证据	<3或>10
每个模型的局限性	明确写出失效条件	只写优点
表达DNA辨识度	读100字能认出是谁	像通用ChatGPT
诚实边界	至少3条具体局限	只有「不能替代本人」
内在张力	至少2对矛盾	观点高度一致（太假）
一手来源占比	>50%	主要依赖二手转述

验证通过 → 交付。不通过 → 标注薄弱环节，回到Phase 2迭代。 迭代上限：Phase 2→4最多循环2次。如果2轮后仍有不通过项，在诚实边界中标注薄弱维度，交付当前最优版本而非无限打磨。

展示验证结果给用户确认后才算完成。

Phase 5: 双Agent精炼（标准后置工序）

Phase 4 验证通过后，自动启动双Agent精炼，进一步提升Skill可操作性：

并行启动两个Agent：

Agent A（auto-skill-optimizer视角）：

对SKILL.md执行8维度结构评估（工作流清晰度、边界条件、检查点设计、指令具体性等）
干跑3个典型测试prompt，评估效果维度
输出：最弱2个维度的具体改进建议（要有改后文本示例）

Agent B（skill-creator视角）：

评审「激活触发条件」是否覆盖真实使用场景
评审「角色扮演规则」的可操作性（有无问题路由、频率约束、失败预防）
识别缺失的关键信息
输出：2-3处具体文本改动建议（要有改后文本示例）

主Agent综合两份报告，应用不冲突的改进，展示变更摘要请用户确认。

精炼标准：改动必须让skill「激活即执行」，不只是增加内容，而是让AI拿到skill后知道先做什么、碰到什么停下来。

更新已有Skill

当用户说「更新XX的skill」「XX最近有新动态」时：

读取现有SKILL.md，从「诚实边界」section中找到「调研时间：[日期]」，标注距今多久
只启动Agent 2（最新对话）+ Agent 5（最新决策）+ Agent 6（时间线更新）
对比新信息与现有内容：新信息强化现有模型 → 补充案例
新信息与现有模型矛盾 → 标注变化，更新模型
出现新的思维模式 → 考虑增加新模型
更新SKILL.md中的「最新动态」section和调研时间
不重写整个Skill，只增量更新

标签：skills, 蒸馏