muratcankoylan/Agent-Skills-for-Context-Engineering
GitHub: muratcankoylan/Agent-Skills-for-Context-Engineering
一个面向上下文工程的开放技能集合,帮助开发者构建、优化和调试需要高效上下文管理的生产级多智能体系统。
Stars: 12941 | Forks: 995
# 上下文工程 Agent Skills
一个全面的、开放的 Agent Skills 集合,专注于构建生产级 AI agent 系统的上下文工程原则。这些技能传授策划上下文的艺术与科学,旨在最大化 agent 在任何 agent 平台上的有效性。
## 什么是 Context Engineering?
Context engineering(上下文工程)是管理语言模型上下文窗口的学科。与专注于制定有效指令的 prompt engineering(提示工程)不同,context engineering 处理的是进入模型有限注意力预算的所有信息的整体策划:系统提示、工具定义、检索到的文档、消息历史和工具输出。
根本性的挑战在于,上下文窗口不仅受限于原始 token 容量,还受注意力机制的制约。随着上下文长度的增加,模型会表现出可预测的退化模式:“中间丢失”现象、U 形注意力曲线和注意力稀缺。有效的 context engineering 意味着找到最小可能的高信号 token 集合,以最大化产生预期结果的可能性。
## 认可
该仓库作为关于静态技能架构的基础性工作被学术研究引用:
— [Meta Context Engineering via Agentic Skill Evolution](https://arxiv.org/pdf/2601.21557),北京大学通用人工智能国家重点实验室 (2026)
## 技能概览
### 基础技能
这些技能建立了所有后续上下文工程工作所需的基础理解。
| 技能 | 描述 |
|-------|-------------|
| [context-fundamentals](skills/context-fundamentals/) | 理解什么是上下文、为何重要,以及 agent 系统中上下文的剖析 |
| [context-degradation](skills/context-degradation/) | 识别上下文失效的模式:中间丢失、污染、分散和冲突 |
| [context-compression](skills/context-compression/) | 设计和评估长时间运行会话的压缩策略 |
### 架构技能
这些技能涵盖了构建有效 agent 系统的模式和结构。
| 技能 | 描述 |
|-------|-------------|
| [multi-agent-patterns](skills/multi-agent-patterns/) | 掌握编排者、点对点和分层式多 agent 架构 |
| [memory-systems](skills/memory-systems/) | 设计短期、长期和基于图的记忆架构 |
| [tool-design](skills/tool-design/) | 构建 agent 可以有效使用的工具 |
| [filesystem-context](skills/filesystem-context/) | 使用文件系统进行动态上下文发现、工具输出卸载和计划持久化 |
| [hosted-agents](skills/hosted-agents/) | **新增** 构建具有沙盒 VM、预构建镜像、多人支持和多客户端界面的后台编码 agent |
### 运维技能
这些技能涉及 agent 系统的持续运行和优化。
| 技能 | 描述 |
|-------|-------------|
| [context-optimization](skills/context-optimization/) | 应用压缩、掩码和缓存策略 |
| [evaluation](skills/evaluation/) | 为 agent 系统构建评估框架 |
| [advanced-evaluation](skills/advanced-evaluation/) | 掌握 LLM-as-a-Judge 技术:直接评分、成对比较、评分标准生成和偏差缓解 |
### 开发方法论
这些技能涵盖了构建 LLM 驱动项目的元级实践。
| 技能 | 描述 |
|-------|-------------|
| [project-development](skills/project-development/) | 从构思到部署设计和构建 LLM 项目,包括任务-模型适配分析、流水线架构和结构化输出设计 |
### 认知架构技能
这些技能涵盖了针对理性 agent 系统的形式化认知建模。
| 技能 | 描述 |
|-------|-------------|
| [bdi-mental-states](skills/bdi-mental-states/) | **新增** 使用形式化 BDI 本体模式将外部 RDF 上下文转换为 agent 心理状态(信念、愿望、意图),用于审慎推理和可解释性 |
## 设计理念
### 渐进式披露
每个技能都为高效的上下文使用而构建。启动时,agent 仅加载技能名称和描述。完整内容仅在与相关任务激活技能时加载。
### 平台无关性
这些技能专注于可迁移的原则,而非特定于供应商的实现。这些模式适用于 Claude Code、Cursor 以及任何支持技能或允许自定义指令的 agent 平台。
### 概念基础与实践案例
脚本和示例使用 Python 伪代码演示概念,这些代码可跨环境工作,无需安装特定的依赖项。
## 用法
### 配合 Claude Code 使用
本仓库是一个 **Claude Code 插件市场**,包含 Claude 根据您的任务上下文自动发现并激活的上下文工程技能。
### 安装
**第 1 步:添加市场**
在 Claude Code 中运行此命令以将此仓库注册为插件源:
```
/plugin marketplace add muratcankoylan/Agent-Skills-for-Context-Engineering
```
**第 2 步:浏览并安装**
选项 A - 浏览可用插件:
1. 选择 `Browse and install plugins`
2. 选择 `context-engineering-marketplace`
3. 选择一个插件(例如 `context-engineering-fundamentals`, `agent-architecture`)
4. 选择 `Install now`
选项 B - 通过命令直接安装:
```
/plugin install context-engineering-fundamentals@context-engineering-marketplace
/plugin install agent-architecture@context-engineering-marketplace
/plugin install agent-evaluation@context-engineering-marketplace
/plugin install agent-development@context-engineering-marketplace
/plugin install cognitive-architecture@context-engineering-marketplace
```
### 可用插件
| 插件 | 包含技能 |
|--------|-----------------|
| `context-engineering-fundamentals` | context-fundamentals, context-degradation, context-compression, context-optimization |
| `agent-architecture` | multi-agent-patterns, memory-systems, tool-design, filesystem-context, hosted-agents |
| `agent-evaluation` | evaluation, advanced-evaluation |
| `agent-development` | project-development |
| `cognitive-architecture` | bdi-mental-states |
### 技能触发器
| 技能 | 触发条件 |
|-------|-------------|
| `context-fundamentals` | “understand context”、“explain context windows”、“design agent architecture” |
| `context-degradation` | “diagnose context problems”、“fix lost-in-middle”、“debug agent failures” |
| `context-compression` | “compress context”、“summarize conversation”、“reduce token usage” |
| `context-optimization` | “optimize context”、“reduce token costs”、“implement KV-cache” |
| `multi-agent-patterns` | “design multi-agent system”、“implement supervisor pattern” |
| `memory-systems` | “implement agent memory”、“build knowledge graph”、“track entities” |
| `tool-design` | “design agent tools”、“reduce tool complexity”、“implement MCP tools” |
| `filesystem-context` | “offload context to files”、“dynamic context discovery”、“agent scratch pad”、“file-based context” |
| `hosted-agents` | “build background agent”、“create hosted coding agent”、“sandboxed execution”、“multiplayer agent”、“Modal sandboxes” |
| `evaluation` | “evaluate agent performance”、“build test framework”、“measure quality” |
| `advanced-evaluation` | “implement LLM-as-judge”、“compare model outputs”、“mitigate bias” |
| `project-development` | “start LLM project”、“design batch pipeline”、“evaluate task-model fit” |
| `bdi-mental-states` | “model agent mental states”、“implement BDI architecture”、“transform RDF to beliefs”、“build cognitive agent” |
### 适用于 Cursor & Codex & IDE
将技能内容复制到 `.rules` 或创建特定于项目的 Skills 文件夹。这些技能提供了 agent 进行有效上下文工程和设计所需的上下文与指南。
### 适用于自定义实现
从任何技能中提取原则和模式,并在您的 agent 框架中实现它们。这些技能是刻意设计为平台无关的。
## 示例
[examples](examples/) 文件夹包含完整的系统设计,展示了多个技能在实践中如何协同工作。
| 示例 | 描述 | 应用的技能 |
|---------|-------------|----------------|
| [digital-brain-skill](examples/digital-brain-skill/) | **新增** 创始人和创作者的个人操作系统。包含 6 个模块、4 个自动化脚本的完整 Claude Code 技能 | context-fundamentals, context-optimization, memory-systems, tool-design, multi-agent-patterns, evaluation, project-development |
| [x-to-book-system](examples/x-to-book-system/) | 监控 X 账户并生成每日综合书籍的多 agent 系统 | multi-agent-patterns, memory-systems, context-optimization, tool-design, evaluation |
| [llm-as-judge-skills](examples/llm-as-judge-skills/) | 生产就绪的 LLM 评估工具,包含 TypeScript 实现,19 个通过的测试 | advanced-evaluation, tool-design, context-fundamentals, evaluation |
| [book-sft-pipeline](examples/book-sft-pipeline/) | 训练模型以任何作者的风格写作。包括格特鲁德·斯坦案例研究,在 Pangram 上获得 70% 的人类评分,总成本 2 美元 | project-development, context-compression, multi-agent-patterns, evaluation |
每个示例包括:
- 包含架构决策的完整 PRD(产品需求文档)
- 技能映射,显示哪些概念影响了每个决策
- 实现指南
### Digital Brain Skill 示例
[digital-brain-skill](examples/digital-brain-skill/) 示例是一个完整的个人操作系统,展示了全面的技能应用:
- **渐进式披露**:3 级加载(SKILL.md → MODULE.md → data 文件)
- **模块隔离**:6 个独立模块(identity, content, knowledge, network, operations, agents)
- **仅追加记忆**:JSONL 文件,带有以 schema 开头的行,便于 agent 解析
- **自动化脚本**:4 个整合工具(weekly_review, content_ideas, stale_contacts, idea_to_draft)
包含 [HOW-SKILLS-BUILT-THIS.md](examples/digital-brain-skill/HOW-SKILLS-BUILT-THIS.md) 中的详细可追溯性,将每个架构决策映射到特定的技能原则。
### LLM-as-Judge Skills 示例
[llm-as-judge-skills](examples/llm-as-judge-skills/) 示例是一个完整的 TypeScript 实现,展示了:
- **直接评分**:根据加权标准和评分细则评估响应
- **成对比较**:比较响应并缓解位置偏差
- **评分标准生成**:创建特定领域的评估标准
- **EvaluatorAgent**:结合所有评估能力的高级 agent
### Book SFT Pipeline 示例
[book-sft-pipeline](examples/book-sft-pipeline/) 示例展示了训练小型模型(8B)以任何作者的风格写作:
- **智能分割**:带重叠的两级分块,以获得最大的训练样本
- **提示多样性**:15+ 个模板,防止死记硬背并强制风格学习
- **Tinker 集成**:完整的 LoRA 训练工作流,总成本 2 美元
- **验证方法**:现代场景测试证明风格迁移而非内容记忆
与上下文工程技能集成:project-development, context-compression, multi-agent-patterns, evaluation。
## 结构
每个技能都遵循 Agent Skills 规范:
```
skill-name/
├── SKILL.md # Required: instructions + metadata
├── scripts/ # Optional: executable code demonstrating concepts
└── references/ # Optional: additional documentation and resources
```
请参阅 [template](template/) 文件夹以了解标准的技能结构。
## 贡献
本仓库遵循 Agent Skills 开放开发模式。欢迎更广泛的生态系统做出贡献。贡献时:
1. 遵循技能模板结构
2. 提供清晰、可执行的指令
3. 在适当的地方包含可运行的示例
4. 记录权衡和潜在问题
5. 将 SKILL.md 保持在 500 行以内以获得最佳性能
欢迎联系 [Muratcan Koylan](https://x.com/koylanai) 探讨合作机会或任何咨询。
## 许可证
MIT 许可证 - 详情请参阅 LICENSE 文件。
## 参考资料
这些技能中的原则源自领先 AI 实验室和框架开发者的研究和生产经验。每个技能都包含参考数据,指向为其建议提供依据的底层研究和案例研究。
— [Meta Context Engineering via Agentic Skill Evolution](https://arxiv.org/pdf/2601.21557),北京大学通用人工智能国家重点实验室 (2026)
## 技能概览
### 基础技能
这些技能建立了所有后续上下文工程工作所需的基础理解。
| 技能 | 描述 |
|-------|-------------|
| [context-fundamentals](skills/context-fundamentals/) | 理解什么是上下文、为何重要,以及 agent 系统中上下文的剖析 |
| [context-degradation](skills/context-degradation/) | 识别上下文失效的模式:中间丢失、污染、分散和冲突 |
| [context-compression](skills/context-compression/) | 设计和评估长时间运行会话的压缩策略 |
### 架构技能
这些技能涵盖了构建有效 agent 系统的模式和结构。
| 技能 | 描述 |
|-------|-------------|
| [multi-agent-patterns](skills/multi-agent-patterns/) | 掌握编排者、点对点和分层式多 agent 架构 |
| [memory-systems](skills/memory-systems/) | 设计短期、长期和基于图的记忆架构 |
| [tool-design](skills/tool-design/) | 构建 agent 可以有效使用的工具 |
| [filesystem-context](skills/filesystem-context/) | 使用文件系统进行动态上下文发现、工具输出卸载和计划持久化 |
| [hosted-agents](skills/hosted-agents/) | **新增** 构建具有沙盒 VM、预构建镜像、多人支持和多客户端界面的后台编码 agent |
### 运维技能
这些技能涉及 agent 系统的持续运行和优化。
| 技能 | 描述 |
|-------|-------------|
| [context-optimization](skills/context-optimization/) | 应用压缩、掩码和缓存策略 |
| [evaluation](skills/evaluation/) | 为 agent 系统构建评估框架 |
| [advanced-evaluation](skills/advanced-evaluation/) | 掌握 LLM-as-a-Judge 技术:直接评分、成对比较、评分标准生成和偏差缓解 |
### 开发方法论
这些技能涵盖了构建 LLM 驱动项目的元级实践。
| 技能 | 描述 |
|-------|-------------|
| [project-development](skills/project-development/) | 从构思到部署设计和构建 LLM 项目,包括任务-模型适配分析、流水线架构和结构化输出设计 |
### 认知架构技能
这些技能涵盖了针对理性 agent 系统的形式化认知建模。
| 技能 | 描述 |
|-------|-------------|
| [bdi-mental-states](skills/bdi-mental-states/) | **新增** 使用形式化 BDI 本体模式将外部 RDF 上下文转换为 agent 心理状态(信念、愿望、意图),用于审慎推理和可解释性 |
## 设计理念
### 渐进式披露
每个技能都为高效的上下文使用而构建。启动时,agent 仅加载技能名称和描述。完整内容仅在与相关任务激活技能时加载。
### 平台无关性
这些技能专注于可迁移的原则,而非特定于供应商的实现。这些模式适用于 Claude Code、Cursor 以及任何支持技能或允许自定义指令的 agent 平台。
### 概念基础与实践案例
脚本和示例使用 Python 伪代码演示概念,这些代码可跨环境工作,无需安装特定的依赖项。
## 用法
### 配合 Claude Code 使用
本仓库是一个 **Claude Code 插件市场**,包含 Claude 根据您的任务上下文自动发现并激活的上下文工程技能。
### 安装
**第 1 步:添加市场**
在 Claude Code 中运行此命令以将此仓库注册为插件源:
```
/plugin marketplace add muratcankoylan/Agent-Skills-for-Context-Engineering
```
**第 2 步:浏览并安装**
选项 A - 浏览可用插件:
1. 选择 `Browse and install plugins`
2. 选择 `context-engineering-marketplace`
3. 选择一个插件(例如 `context-engineering-fundamentals`, `agent-architecture`)
4. 选择 `Install now`
选项 B - 通过命令直接安装:
```
/plugin install context-engineering-fundamentals@context-engineering-marketplace
/plugin install agent-architecture@context-engineering-marketplace
/plugin install agent-evaluation@context-engineering-marketplace
/plugin install agent-development@context-engineering-marketplace
/plugin install cognitive-architecture@context-engineering-marketplace
```
### 可用插件
| 插件 | 包含技能 |
|--------|-----------------|
| `context-engineering-fundamentals` | context-fundamentals, context-degradation, context-compression, context-optimization |
| `agent-architecture` | multi-agent-patterns, memory-systems, tool-design, filesystem-context, hosted-agents |
| `agent-evaluation` | evaluation, advanced-evaluation |
| `agent-development` | project-development |
| `cognitive-architecture` | bdi-mental-states |
### 技能触发器
| 技能 | 触发条件 |
|-------|-------------|
| `context-fundamentals` | “understand context”、“explain context windows”、“design agent architecture” |
| `context-degradation` | “diagnose context problems”、“fix lost-in-middle”、“debug agent failures” |
| `context-compression` | “compress context”、“summarize conversation”、“reduce token usage” |
| `context-optimization` | “optimize context”、“reduce token costs”、“implement KV-cache” |
| `multi-agent-patterns` | “design multi-agent system”、“implement supervisor pattern” |
| `memory-systems` | “implement agent memory”、“build knowledge graph”、“track entities” |
| `tool-design` | “design agent tools”、“reduce tool complexity”、“implement MCP tools” |
| `filesystem-context` | “offload context to files”、“dynamic context discovery”、“agent scratch pad”、“file-based context” |
| `hosted-agents` | “build background agent”、“create hosted coding agent”、“sandboxed execution”、“multiplayer agent”、“Modal sandboxes” |
| `evaluation` | “evaluate agent performance”、“build test framework”、“measure quality” |
| `advanced-evaluation` | “implement LLM-as-judge”、“compare model outputs”、“mitigate bias” |
| `project-development` | “start LLM project”、“design batch pipeline”、“evaluate task-model fit” |
| `bdi-mental-states` | “model agent mental states”、“implement BDI architecture”、“transform RDF to beliefs”、“build cognitive agent” |
### 适用于 Cursor & Codex & IDE
将技能内容复制到 `.rules` 或创建特定于项目的 Skills 文件夹。这些技能提供了 agent 进行有效上下文工程和设计所需的上下文与指南。
### 适用于自定义实现
从任何技能中提取原则和模式,并在您的 agent 框架中实现它们。这些技能是刻意设计为平台无关的。
## 示例
[examples](examples/) 文件夹包含完整的系统设计,展示了多个技能在实践中如何协同工作。
| 示例 | 描述 | 应用的技能 |
|---------|-------------|----------------|
| [digital-brain-skill](examples/digital-brain-skill/) | **新增** 创始人和创作者的个人操作系统。包含 6 个模块、4 个自动化脚本的完整 Claude Code 技能 | context-fundamentals, context-optimization, memory-systems, tool-design, multi-agent-patterns, evaluation, project-development |
| [x-to-book-system](examples/x-to-book-system/) | 监控 X 账户并生成每日综合书籍的多 agent 系统 | multi-agent-patterns, memory-systems, context-optimization, tool-design, evaluation |
| [llm-as-judge-skills](examples/llm-as-judge-skills/) | 生产就绪的 LLM 评估工具,包含 TypeScript 实现,19 个通过的测试 | advanced-evaluation, tool-design, context-fundamentals, evaluation |
| [book-sft-pipeline](examples/book-sft-pipeline/) | 训练模型以任何作者的风格写作。包括格特鲁德·斯坦案例研究,在 Pangram 上获得 70% 的人类评分,总成本 2 美元 | project-development, context-compression, multi-agent-patterns, evaluation |
每个示例包括:
- 包含架构决策的完整 PRD(产品需求文档)
- 技能映射,显示哪些概念影响了每个决策
- 实现指南
### Digital Brain Skill 示例
[digital-brain-skill](examples/digital-brain-skill/) 示例是一个完整的个人操作系统,展示了全面的技能应用:
- **渐进式披露**:3 级加载(SKILL.md → MODULE.md → data 文件)
- **模块隔离**:6 个独立模块(identity, content, knowledge, network, operations, agents)
- **仅追加记忆**:JSONL 文件,带有以 schema 开头的行,便于 agent 解析
- **自动化脚本**:4 个整合工具(weekly_review, content_ideas, stale_contacts, idea_to_draft)
包含 [HOW-SKILLS-BUILT-THIS.md](examples/digital-brain-skill/HOW-SKILLS-BUILT-THIS.md) 中的详细可追溯性,将每个架构决策映射到特定的技能原则。
### LLM-as-Judge Skills 示例
[llm-as-judge-skills](examples/llm-as-judge-skills/) 示例是一个完整的 TypeScript 实现,展示了:
- **直接评分**:根据加权标准和评分细则评估响应
- **成对比较**:比较响应并缓解位置偏差
- **评分标准生成**:创建特定领域的评估标准
- **EvaluatorAgent**:结合所有评估能力的高级 agent
### Book SFT Pipeline 示例
[book-sft-pipeline](examples/book-sft-pipeline/) 示例展示了训练小型模型(8B)以任何作者的风格写作:
- **智能分割**:带重叠的两级分块,以获得最大的训练样本
- **提示多样性**:15+ 个模板,防止死记硬背并强制风格学习
- **Tinker 集成**:完整的 LoRA 训练工作流,总成本 2 美元
- **验证方法**:现代场景测试证明风格迁移而非内容记忆
与上下文工程技能集成:project-development, context-compression, multi-agent-patterns, evaluation。
## 结构
每个技能都遵循 Agent Skills 规范:
```
skill-name/
├── SKILL.md # Required: instructions + metadata
├── scripts/ # Optional: executable code demonstrating concepts
└── references/ # Optional: additional documentation and resources
```
请参阅 [template](template/) 文件夹以了解标准的技能结构。
## 贡献
本仓库遵循 Agent Skills 开放开发模式。欢迎更广泛的生态系统做出贡献。贡献时:
1. 遵循技能模板结构
2. 提供清晰、可执行的指令
3. 在适当的地方包含可运行的示例
4. 记录权衡和潜在问题
5. 将 SKILL.md 保持在 500 行以内以获得最佳性能
欢迎联系 [Muratcan Koylan](https://x.com/koylanai) 探讨合作机会或任何咨询。
## 许可证
MIT 许可证 - 详情请参阅 LICENSE 文件。
## 参考资料
这些技能中的原则源自领先 AI 实验室和框架开发者的研究和生产经验。每个技能都包含参考数据,指向为其建议提供依据的底层研究和案例研究。标签:Agent开发框架, AI代理, AI工程化, AI技能库, DLL 劫持, DNS解析, LLM应用开发, PyRIT, RAG, Token优化, 上下文工程, 上下文窗口, 上下文管理, 人工智能, 多智能体系统, 大语言模型, 开源项目, 时序数据库, 智能体架构, 模型上下文, 注意力机制, 生产级AI, 用户模式Hook绕过, 逆向工具