muratcankoylan/Agent-Skills-for-Context-Engineering

GitHub: muratcankoylan/Agent-Skills-for-Context-Engineering

一个面向上下文工程的开放技能集合，帮助开发者构建、优化和调试需要高效上下文管理的生产级多智能体系统。

Stars: 12941 | Forks: 995

# 上下文工程 Agent Skills 一个全面的、开放的 Agent Skills 集合，专注于构建生产级 AI agent 系统的上下文工程原则。这些技能传授策划上下文的艺术与科学，旨在最大化 agent 在任何 agent 平台上的有效性。 ## 什么是 Context Engineering？ Context engineering（上下文工程）是管理语言模型上下文窗口的学科。与专注于制定有效指令的 prompt engineering（提示工程）不同，context engineering 处理的是进入模型有限注意力预算的所有信息的整体策划：系统提示、工具定义、检索到的文档、消息历史和工具输出。根本性的挑战在于，上下文窗口不仅受限于原始 token 容量，还受注意力机制的制约。随着上下文长度的增加，模型会表现出可预测的退化模式：“中间丢失”现象、U 形注意力曲线和注意力稀缺。有效的 context engineering 意味着找到最小可能的高信号 token 集合，以最大化产生预期结果的可能性。 ## 认可该仓库作为关于静态技能架构的基础性工作被学术研究引用： Screenshot 2025-12-26 at 12 34 47 PM

— [Meta Context Engineering via Agentic Skill Evolution](https://arxiv.org/pdf/2601.21557)，北京大学通用人工智能国家重点实验室 (2026) ## 技能概览 ### 基础技能这些技能建立了所有后续上下文工程工作所需的基础理解。 | 技能 | 描述 | |-------|-------------| | [context-fundamentals](skills/context-fundamentals/) | 理解什么是上下文、为何重要，以及 agent 系统中上下文的剖析 | | [context-degradation](skills/context-degradation/) | 识别上下文失效的模式：中间丢失、污染、分散和冲突 | | [context-compression](skills/context-compression/) | 设计和评估长时间运行会话的压缩策略 | ### 架构技能这些技能涵盖了构建有效 agent 系统的模式和结构。 | 技能 | 描述 | |-------|-------------| | [multi-agent-patterns](skills/multi-agent-patterns/) | 掌握编排者、点对点和分层式多 agent 架构 | | [memory-systems](skills/memory-systems/) | 设计短期、长期和基于图的记忆架构 | | [tool-design](skills/tool-design/) | 构建 agent 可以有效使用的工具 | | [filesystem-context](skills/filesystem-context/) | 使用文件系统进行动态上下文发现、工具输出卸载和计划持久化 | | [hosted-agents](skills/hosted-agents/) | **新增** 构建具有沙盒 VM、预构建镜像、多人支持和多客户端界面的后台编码 agent | ### 运维技能这些技能涉及 agent 系统的持续运行和优化。 | 技能 | 描述 | |-------|-------------| | [context-optimization](skills/context-optimization/) | 应用压缩、掩码和缓存策略 | | [evaluation](skills/evaluation/) | 为 agent 系统构建评估框架 | | [advanced-evaluation](skills/advanced-evaluation/) | 掌握 LLM-as-a-Judge 技术：直接评分、成对比较、评分标准生成和偏差缓解 | ### 开发方法论这些技能涵盖了构建 LLM 驱动项目的元级实践。 | 技能 | 描述 | |-------|-------------| | [project-development](skills/project-development/) | 从构思到部署设计和构建 LLM 项目，包括任务-模型适配分析、流水线架构和结构化输出设计 | ### 认知架构技能这些技能涵盖了针对理性 agent 系统的形式化认知建模。 | 技能 | 描述 | |-------|-------------| | [bdi-mental-states](skills/bdi-mental-states/) | **新增** 使用形式化 BDI 本体模式将外部 RDF 上下文转换为 agent 心理状态（信念、愿望、意图），用于审慎推理和可解释性 | ## 设计理念 ### 渐进式披露每个技能都为高效的上下文使用而构建。启动时，agent 仅加载技能名称和描述。完整内容仅在与相关任务激活技能时加载。 ### 平台无关性这些技能专注于可迁移的原则，而非特定于供应商的实现。这些模式适用于 Claude Code、Cursor 以及任何支持技能或允许自定义指令的 agent 平台。 ### 概念基础与实践案例脚本和示例使用 Python 伪代码演示概念，这些代码可跨环境工作，无需安装特定的依赖项。 ## 用法 ### 配合 Claude Code 使用本仓库是一个 **Claude Code 插件市场**，包含 Claude 根据您的任务上下文自动发现并激活的上下文工程技能。 ### 安装 **第 1 步：添加市场** 在 Claude Code 中运行此命令以将此仓库注册为插件源： ``` /plugin marketplace add muratcankoylan/Agent-Skills-for-Context-Engineering ``` **第 2 步：浏览并安装** 选项 A - 浏览可用插件： 1. 选择 `Browse and install plugins` 2. 选择 `context-engineering-marketplace` 3. 选择一个插件（例如 `context-engineering-fundamentals`, `agent-architecture`） 4. 选择 `Install now` 选项 B - 通过命令直接安装： ``` /plugin install context-engineering-fundamentals@context-engineering-marketplace /plugin install agent-architecture@context-engineering-marketplace /plugin install agent-evaluation@context-engineering-marketplace /plugin install agent-development@context-engineering-marketplace /plugin install cognitive-architecture@context-engineering-marketplace ``` ### 可用插件 | 插件 | 包含技能 | |--------|-----------------| | `context-engineering-fundamentals` | context-fundamentals, context-degradation, context-compression, context-optimization | | `agent-architecture` | multi-agent-patterns, memory-systems, tool-design, filesystem-context, hosted-agents | | `agent-evaluation` | evaluation, advanced-evaluation | | `agent-development` | project-development | | `cognitive-architecture` | bdi-mental-states | ### 技能触发器 | 技能 | 触发条件 | |-------|-------------| | `context-fundamentals` | “understand context”、“explain context windows”、“design agent architecture” | | `context-degradation` | “diagnose context problems”、“fix lost-in-middle”、“debug agent failures” | | `context-compression` | “compress context”、“summarize conversation”、“reduce token usage” | | `context-optimization` | “optimize context”、“reduce token costs”、“implement KV-cache” | | `multi-agent-patterns` | “design multi-agent system”、“implement supervisor pattern” | | `memory-systems` | “implement agent memory”、“build knowledge graph”、“track entities” | | `tool-design` | “design agent tools”、“reduce tool complexity”、“implement MCP tools” | | `filesystem-context` | “offload context to files”、“dynamic context discovery”、“agent scratch pad”、“file-based context” | | `hosted-agents` | “build background agent”、“create hosted coding agent”、“sandboxed execution”、“multiplayer agent”、“Modal sandboxes” | | `evaluation` | “evaluate agent performance”、“build test framework”、“measure quality” | | `advanced-evaluation` | “implement LLM-as-judge”、“compare model outputs”、“mitigate bias” | | `project-development` | “start LLM project”、“design batch pipeline”、“evaluate task-model fit” | | `bdi-mental-states` | “model agent mental states”、“implement BDI architecture”、“transform RDF to beliefs”、“build cognitive agent” | ### 适用于 Cursor & Codex & IDE 将技能内容复制到 `.rules` 或创建特定于项目的 Skills 文件夹。这些技能提供了 agent 进行有效上下文工程和设计所需的上下文与指南。 ### 适用于自定义实现从任何技能中提取原则和模式，并在您的 agent 框架中实现它们。这些技能是刻意设计为平台无关的。 ## 示例 [examples](examples/) 文件夹包含完整的系统设计，展示了多个技能在实践中如何协同工作。 | 示例 | 描述 | 应用的技能 | |---------|-------------|----------------| | [digital-brain-skill](examples/digital-brain-skill/) | **新增** 创始人和创作者的个人操作系统。包含 6 个模块、4 个自动化脚本的完整 Claude Code 技能 | context-fundamentals, context-optimization, memory-systems, tool-design, multi-agent-patterns, evaluation, project-development | | [x-to-book-system](examples/x-to-book-system/) | 监控 X 账户并生成每日综合书籍的多 agent 系统 | multi-agent-patterns, memory-systems, context-optimization, tool-design, evaluation | | [llm-as-judge-skills](examples/llm-as-judge-skills/) | 生产就绪的 LLM 评估工具，包含 TypeScript 实现，19 个通过的测试 | advanced-evaluation, tool-design, context-fundamentals, evaluation | | [book-sft-pipeline](examples/book-sft-pipeline/) | 训练模型以任何作者的风格写作。包括格特鲁德·斯坦案例研究，在 Pangram 上获得 70% 的人类评分，总成本 2 美元 | project-development, context-compression, multi-agent-patterns, evaluation | 每个示例包括： - 包含架构决策的完整 PRD（产品需求文档） - 技能映射，显示哪些概念影响了每个决策 - 实现指南 ### Digital Brain Skill 示例 [digital-brain-skill](examples/digital-brain-skill/) 示例是一个完整的个人操作系统，展示了全面的技能应用： - **渐进式披露**：3 级加载（SKILL.md → MODULE.md → data 文件） - **模块隔离**：6 个独立模块（identity, content, knowledge, network, operations, agents） - **仅追加记忆**：JSONL 文件，带有以 schema 开头的行，便于 agent 解析 - **自动化脚本**：4 个整合工具（weekly_review, content_ideas, stale_contacts, idea_to_draft）包含 [HOW-SKILLS-BUILT-THIS.md](examples/digital-brain-skill/HOW-SKILLS-BUILT-THIS.md) 中的详细可追溯性，将每个架构决策映射到特定的技能原则。 ### LLM-as-Judge Skills 示例 [llm-as-judge-skills](examples/llm-as-judge-skills/) 示例是一个完整的 TypeScript 实现，展示了： - **直接评分**：根据加权标准和评分细则评估响应 - **成对比较**：比较响应并缓解位置偏差 - **评分标准生成**：创建特定领域的评估标准 - **EvaluatorAgent**：结合所有评估能力的高级 agent ### Book SFT Pipeline 示例 [book-sft-pipeline](examples/book-sft-pipeline/) 示例展示了训练小型模型（8B）以任何作者的风格写作： - **智能分割**：带重叠的两级分块，以获得最大的训练样本 - **提示多样性**：15+ 个模板，防止死记硬背并强制风格学习 - **Tinker 集成**：完整的 LoRA 训练工作流，总成本 2 美元 - **验证方法**：现代场景测试证明风格迁移而非内容记忆与上下文工程技能集成：project-development, context-compression, multi-agent-patterns, evaluation。 ## 结构每个技能都遵循 Agent Skills 规范： ``` skill-name/ ├── SKILL.md # Required: instructions + metadata ├── scripts/ # Optional: executable code demonstrating concepts └── references/ # Optional: additional documentation and resources ``` 请参阅 [template](template/) 文件夹以了解标准的技能结构。 ## 贡献本仓库遵循 Agent Skills 开放开发模式。欢迎更广泛的生态系统做出贡献。贡献时： 1. 遵循技能模板结构 2. 提供清晰、可执行的指令 3. 在适当的地方包含可运行的示例 4. 记录权衡和潜在问题 5. 将 SKILL.md 保持在 500 行以内以获得最佳性能欢迎联系 [Muratcan Koylan](https://x.com/koylanai) 探讨合作机会或任何咨询。 ## 许可证 MIT 许可证 - 详情请参阅 LICENSE 文件。 ## 参考资料这些技能中的原则源自领先 AI 实验室和框架开发者的研究和生产经验。每个技能都包含参考数据，指向为其建议提供依据的底层研究和案例研究。

标签：Agent开发框架, AI代理, AI工程化, AI技能库, DLL 劫持, DNS解析, LLM应用开发, PyRIT, RAG, Token优化, 上下文工程, 上下文窗口, 上下文管理, 人工智能, 多智能体系统, 大语言模型, 开源项目, 时序数据库, 智能体架构, 模型上下文, 注意力机制, 生产级AI, 用户模式Hook绕过, 逆向工具