aget-framework/template-operator-aget

GitHub: aget-framework/template-operator-aget

面向 SRE 和运维团队的 AI Agent 模板,专注于结构化事件响应和 Playbook 执行,通过积累领域知识提升运维效率。

Stars: 0 | Forks: 0

# 模板:Operator Agent **版本**: v3.8.0 | **原型**: Operator | **技能**: 2 项专业 + 15 项通用 ## 为什么选择 Operator? Operator 原型确保系统和服务的**运行可靠性**。与专注于开发的 Agent 不同,Operator Agent 专长于: - **事件响应** — 通过结构化的分类、调查和解决流程来处理问题 - **Playbook 执行** — 运行标准操作流程,并进行跟踪和验证 - **系统健康** — 通过主动监控维持运行连续性 **致评估者**:如果您需要一款能够有条不紊地处理事件并可靠执行操作流程的 AI,Operator 原型能为您的流程带来 SRE 纪律。 **不断积累的领域知识**:Operator Agent 会构建对您运行环境的持续理解——反复出现的事件、有效的 Runbook、系统依赖关系以及解决模式。与每次会话都从零开始的工具不同,您的 Agent 会积累运行上下文,从而加快每次事件响应的速度,并提高每次 Playbook 执行的可靠性。 ## 技能 Operator Agent 配备了 **2 项原型特定技能** 以及通用的 AGET 技能。 ### 原型技能 | 技能 | 描述 | |-------|-------------| | **aget-handle-incident** | 通过结构化的分类、影响评估和解决跟踪来处理事件。记录时间线和操作。 | | **aget-run-playbook** | 执行操作 Playbook,包含步骤验证和回滚选项。跟踪完成状态和异常情况。 | ### 通用技能 所有 AGET Agent 都包含会话管理、知识获取和健康监控: - `aget-wake-up` / `aget-wind-down` — 会话生命周期 - `aget-create-project` / `aget-review-project` — 项目管理 - `aget-record-lesson` / `aget-capture-observation` — 学习记录 - `aget-check-health` / `aget-check-kb` / `aget-check-evolution` — 健康监控 - `aget-propose-skill` / `aget-create-skill` — 技能开发 - `aget-save-state` / `aget-file-issue` — 状态和问题管理 ## 本体论 Operator Agent 使用包含 7 个概念的**形式化词汇表**,分为 2 个集群: | 集群 | 概念 | |---------|----------| | **Incident Management** | Incident, Severity, Resolution, Timeline | | **Operations** | Playbook, Step, Runbook | 此词汇表能够实现关于操作活动的精确沟通。 参见:[`ontology/ONTOLOGY_operator.yaml`](ontology/ONTOLOGY_operator.yaml) ## 快速开始 ``` # 1. 克隆 template git clone https://github.com/aget-framework/template-operator-aget.git my-operator-agent cd my-operator-agent # 2. 配置身份 # 编辑 .aget/version.json: # "agent_name": "my-operator-agent" # "domain": "your-domain" # 3. 验证设置 python3 -m pytest tests/ -v # 预期:All tests passing ``` ### 试用技能 ``` # 在 Claude Code CLI /aget-handle-incident # Respond to an incident /aget-run-playbook # Execute operational procedure ``` ## Operator 的独特之处 | 方面 | 临时响应 | Operator Agent | |--------|----------------|----------------| | **Incidents** | 被动混乱 | 结构化的分类和解决 | | **Procedures** | 手动步骤 | 经验证的 Playbook 执行 | | **Documentation** | 事后补充 | 实时时间线 | | **Rollback** | 临时发挥 | 计划好的回滚路径 | | **Domain memory** | 每次会话从零开始 | 随时间积累运维专业知识 | ## .claude/ 目录 | 目录 | 用途 | 所有者 | |-----------|---------|-------| | `.claude/skills/` | Slash 命令定义 | 框架 + Agent | | `.claude/agents/` | Subagent 定义 | Agent | | `.claude/rules/` | 路径范围上下文规则 | Agent | 技能由模板提供。Agent 和 Rules 目录已搭建完毕,供您自定义。 ## 框架规格 | 属性 | 值 | |-----------|-------| | **Framework** | [AGET v3.8.0](https://github.com/aget-framework/aget) | | **Archetype** | Operator | | **Skills** | 17 项总计 (2 项原型 + 15 项通用) | | **Ontology** | 7 个概念, 2 个集群 | | **License** | Apache 2.0 | ## 了解更多 - **[AGET Framework](https://github.com/aget-framework/aget)** — 核心框架文档 - **[Archetype Guide](https://github.com/aget-framework/aget/blob/main/docs/GETTING_STARTED.md)** — 全部 12 种原型详解 - **[Getting Started](https://github.com/aget-framework/aget/blob/main/docs/GETTING_STARTED.md)** — 完整入门指南 ## 相关原型 | 原型 | 最适合 | |-----------|----------| | **[Worker](https://github.com/aget-framework/template-worker-aget)** | 任务执行 | | **[Developer](https://github.com/aget-framework/template-developer-aget)** | 代码和构建流程 | | **[Supervisor](https://github.com/aget-framework/template-supervisor-aget)** | Fleet 协调 | **AGET Framework** | Apache 2.0 | [Issues](https://github.com/aget-framework/template-operator-aget/issues)
标签:Incident Response, Operator, Playbook, SRE, 事故管理, 企业级AI, 偏差过滤, 分类分级, 工作流自动化, 影响评估, 故障排查, 服务连续性, 知识捕获, 站点可靠性工程, 系统健康监控, 运维模板, 运维自动化, 运营可靠性, 运行手册, 逆向工具