aws-samples/sample-code-for-devops-agent-skills
GitHub: aws-samples/sample-code-for-devops-agent-skills
AWS DevOps Agent技能扩展库,助力DevOps运维和事件响应。
Stars: 6 | Forks: 2
# AWS DevOps Agent 技能


为 [AWS DevOps Agent](https://aws.amazon.com/devops-agent/) 提供的开源技能,可扩展其事件响应、根本原因分析和操作故障排除的能力。
每个技能都提供特定领域的知识、决策树和调查过程中代理遵循的逐步运行手册。直接使用它们来增强您的代理,或作为编写自定义技能的模板。
所有技能都使用 [Agent Skill Eval](https://github.com/aws-samples/sample-agent-skill-eval) 和 DevOps Agent 网页应用手动测试,以验证功能是否正常,以及技能的有效触发。测试报告位于每个技能的 `evals/` 目录中。
## 什么是 AWS DevOps Agent 技能?
AWS DevOps Agent 技能是结构化指令集,用于教授代理如何调查特定的操作场景。技能遵循开放的 [Agent Skills 规范](https://agentskills.io/home),并可以上传到您的 DevOps Agent 部署中,以扩展其内置功能之外的知识。
技能使 DevOps Agent 能够:
- 专注于针对您的基础设施的调查程序、最佳实践和组织知识
- 在调查期间自动加载相关指令,消除重复的指导
- 组合多个技能以实现端到端的调查工作流程(例如,从您的 CI/CD 管道检索部署并搜索代码存储库)
- 引导代理有效地使用您的自定义 MCP 服务器工具进行特定于基础设施的工作流程
## 可用技能
| 技能 | 描述 | 代理类型 | 作者 | 文档 |
|-------|-------------|-------------|--------|------|
| [aws-health-events](skills/aws-health-events/) | 检索和分析 AWS Health 事件(服务问题、计划变更、账户通知),以识别与操作问题相关的 AWS 端事件 | 聊天任务、事件根本原因分析 | [udid-aws](https://github.com/udid-aws) | [README](skills/aws-health-events/README.md) |
| [support-cases](skills/support-cases/) | 搜索和分析 AWS Support 事件,以找到具有类似症状、已证明的修复方案和重复模式的历史事件 | 聊天任务、事件根本原因分析 | [udid-aws](https://github.com/udid-aws) | [README](skills/support-cases/README.md) |
| [eks-operation-review](skills/eks-operation-review/) | 执行与 AWS EKS 最佳实践指南一致的全面 Amazon EKS 操作审查,涵盖安全性、可靠性、网络和可伸缩性 | 聊天任务、预防 | [yakiratz-aws](https://github.com/yakiratz-aws) | [README](skills/eks-operation-review/README.md) |
| [rds-operation-review](skills/rds-operation-review/) | 执行全面的 Amazon RDS 操作审查 | 聊天任务、预防 | [yakiratz-aws](https://github.com/yakiratz-aws) | [README](skills/rds-operation-review/README.md) |
## 入门
### 1. 克隆仓库
```
git clone https://github.com/aws-samples/sample-code-for-devops-agent-skills.git
cd sample-code-for-devops-agent-skills
```
### 2. 选择一个技能
浏览上面的技能表,并阅读技能的 `README.md` 以获取其目的、先决条件和示例提示的详细信息。
### 3. 上传到 AWS DevOps Agent
将技能目录(请参阅每个技能的 README 中的 zip 命令)压缩,并通过 [AWS DevOps Agent Operator Web App](https://docs.aws.amazon.com/devopsagent/latest/userguide/about-aws-devops-agent-devops-agent-skills.html#creating-skills) 上传。每个技能的 README 中都有详细的说明。
## 技能目录结构
每个技能都遵循基于 [Agent Skills 规范](https://agentskills.io/home) 的一致结构:
```
skills//
├── SKILL.md # Main skill instructions with frontmatter (required)
├── README.md # Documentation, prerequisites, and upload guide
├── CHANGELOG.md # Version history
├── evals/ # Evaluation queries and benchmarks
├── assets/ # Images, diagrams, data files (optional)
└── references/ # Supplementary reference docs (optional)
```
`SKILL.md`、`references/` 和 `assets/` 目录是 AWS DevOps Agent 在运行时读取的。其余内容支持开发、测试和文档。
## 编写您自己的技能
想要为您的操作工作流程创建自定义技能?请参阅 [AWS DevOps Agent 技能文档](https://docs.aws.amazon.com/devopsagent/latest/userguide/about-aws-devops-agent-devops-agent-skills.html) 以获取完整的指南,或使用此存储库中的技能作为模板。
有效技能的关键原则(另请参阅 [Agent Skills 最佳实践](https://agentskills.io/skill-creation/best-practices)):
- 决定 DevOps Agent 中哪些代理类型与您的技能相关
- 编写描述,指定何时以及为什么技能应该激活——包括特定的症状、服务或错误模式,这些可以触发它
- 将指令建立在真实的专业知识上——具体的 API 模式、边缘情况和项目约定,而不是通用的建议
- 保持 `SKILL.md` 简洁,不超过 500 行;将详细参考资料移动到 `references/`
- 添加代理本身不知道的内容——省略一般概念的解释
- 倾向于逐步程序而不是声明性语句,以便方法可以跨任务泛化
- 包括决策树以处理分支场景,以及多步工作流程的清单
- 提供默认值而不是菜单——选择推荐的方法,并简要提及替代方案
- 包括一个“陷阱”部分,用于包含不合理假设的事实
- 使用 [Agent Skill Eval](https://github.com/aws-samples/sample-agent-skill-eval) 框架进行测试,并使用 DevOps Agent 网页应用手动测试,包括和不含技能
## 贡献
我们欢迎对新技能和现有技能改进的贡献。请参阅 [CONTRIBUTING](CONTRIBUTING.md) 以获取指南。
## 参考资料
### AWS 文档
- [AWS DevOps Agent 产品页面](https://aws.amazon.com/devops-agent/)
- [AWS DevOps Agent 用户指南](https://docs.aws.amazon.com/devopsagent/latest/userguide/about-aws-devops-agent.html)
- [AWS DevOps Agent API 参考](https://docs.aws.amazon.com/devopsagent/latest/APIReference/Welcome.html)
- [AWS DevOps Agent 技能——创建和上传技能](https://docs.aws.amazon.com/devopsagent/latest/userguide/about-aws-devops-agent-devops-agent-skills.html)
### 博客文章
- [使用自定义技能扩展 AWS DevOps Agent 以满足您的操作工作流程](https://builder.aws.com/content/3BDdQAFY2bSmtjecZC7vbOQGSEV/extend-aws-devops-agent-with-custom-skills-for-your-operational-workflows)
- [使用 AWS DevOps Agent 构建端到端 Agentic SRE](https://aws.amazon.com/blogs/devops/building-an-end-to-end-agentic-sre-using-aws-devops-agent/)
- [在生产中部署 AWS DevOps Agent 的最佳实践](https://aws.amazon.com/blogs/devops/best-practices-for-deploying-aws-devops-agent-in-production/)
- [利用 Agentic AI 使用 AWS DevOps Agent 进行自主事件响应](https://aws.amazon.com/blogs/devops/leverage-agentic-ai-for-autonomous-incident-response-with-aws-devops-agent/)
### 规范和工具
- [Agent Skills 规范](https://agentskills.io/home) —— 本项目遵循的开放标准
- [Agent Skill Eval](https://github.com/aws-samples/sample-agent-skill-eval) —— 测试技能的评估框架
## 许可证
此库采用 MIT-0 许可证。请参阅 LICENSE 文件。
标签:Agent, AWS, DPI, MCP服务器, 代码检索, 基础设施监控, 工作流, 开源, 技能, 技能模板, 技能评估, 故障分析, 日志审计, 最佳实践, 组织知识, 网络调试, 自动化, 运维调试, 逆向工具