aget-framework/template-operator-aget
GitHub: aget-framework/template-operator-aget
面向 SRE 和运维团队的 AI Agent 模板,专注于结构化事件响应和 Playbook 执行,通过积累领域知识提升运维效率。
Stars: 0 | Forks: 0
# 模板:Operator Agent
**版本**: v3.8.0 | **原型**: Operator | **技能**: 2 项专业 + 15 项通用
## 为什么选择 Operator?
Operator 原型确保系统和服务的**运行可靠性**。与专注于开发的 Agent 不同,Operator Agent 专长于:
- **事件响应** — 通过结构化的分类、调查和解决流程来处理问题
- **Playbook 执行** — 运行标准操作流程,并进行跟踪和验证
- **系统健康** — 通过主动监控维持运行连续性
**致评估者**:如果您需要一款能够有条不紊地处理事件并可靠执行操作流程的 AI,Operator 原型能为您的流程带来 SRE 纪律。
**不断积累的领域知识**:Operator Agent 会构建对您运行环境的持续理解——反复出现的事件、有效的 Runbook、系统依赖关系以及解决模式。与每次会话都从零开始的工具不同,您的 Agent 会积累运行上下文,从而加快每次事件响应的速度,并提高每次 Playbook 执行的可靠性。
## 技能
Operator Agent 配备了 **2 项原型特定技能** 以及通用的 AGET 技能。
### 原型技能
| 技能 | 描述 |
|-------|-------------|
| **aget-handle-incident** | 通过结构化的分类、影响评估和解决跟踪来处理事件。记录时间线和操作。 |
| **aget-run-playbook** | 执行操作 Playbook,包含步骤验证和回滚选项。跟踪完成状态和异常情况。 |
### 通用技能
所有 AGET Agent 都包含会话管理、知识获取和健康监控:
- `aget-wake-up` / `aget-wind-down` — 会话生命周期
- `aget-create-project` / `aget-review-project` — 项目管理
- `aget-record-lesson` / `aget-capture-observation` — 学习记录
- `aget-check-health` / `aget-check-kb` / `aget-check-evolution` — 健康监控
- `aget-propose-skill` / `aget-create-skill` — 技能开发
- `aget-save-state` / `aget-file-issue` — 状态和问题管理
## 本体论
Operator Agent 使用包含 7 个概念的**形式化词汇表**,分为 2 个集群:
| 集群 | 概念 |
|---------|----------|
| **Incident Management** | Incident, Severity, Resolution, Timeline |
| **Operations** | Playbook, Step, Runbook |
此词汇表能够实现关于操作活动的精确沟通。
参见:[`ontology/ONTOLOGY_operator.yaml`](ontology/ONTOLOGY_operator.yaml)
## 快速开始
```
# 1. 克隆 template
git clone https://github.com/aget-framework/template-operator-aget.git my-operator-agent
cd my-operator-agent
# 2. 配置身份
# 编辑 .aget/version.json:
# "agent_name": "my-operator-agent"
# "domain": "your-domain"
# 3. 验证设置
python3 -m pytest tests/ -v
# 预期:All tests passing
```
### 试用技能
```
# 在 Claude Code CLI
/aget-handle-incident # Respond to an incident
/aget-run-playbook # Execute operational procedure
```
## Operator 的独特之处
| 方面 | 临时响应 | Operator Agent |
|--------|----------------|----------------|
| **Incidents** | 被动混乱 | 结构化的分类和解决 |
| **Procedures** | 手动步骤 | 经验证的 Playbook 执行 |
| **Documentation** | 事后补充 | 实时时间线 |
| **Rollback** | 临时发挥 | 计划好的回滚路径 |
| **Domain memory** | 每次会话从零开始 | 随时间积累运维专业知识 |
## .claude/ 目录
| 目录 | 用途 | 所有者 |
|-----------|---------|-------|
| `.claude/skills/` | Slash 命令定义 | 框架 + Agent |
| `.claude/agents/` | Subagent 定义 | Agent |
| `.claude/rules/` | 路径范围上下文规则 | Agent |
技能由模板提供。Agent 和 Rules 目录已搭建完毕,供您自定义。
## 框架规格
| 属性 | 值 |
|-----------|-------|
| **Framework** | [AGET v3.8.0](https://github.com/aget-framework/aget) |
| **Archetype** | Operator |
| **Skills** | 17 项总计 (2 项原型 + 15 项通用) |
| **Ontology** | 7 个概念, 2 个集群 |
| **License** | Apache 2.0 |
## 了解更多
- **[AGET Framework](https://github.com/aget-framework/aget)** — 核心框架文档
- **[Archetype Guide](https://github.com/aget-framework/aget/blob/main/docs/GETTING_STARTED.md)** — 全部 12 种原型详解
- **[Getting Started](https://github.com/aget-framework/aget/blob/main/docs/GETTING_STARTED.md)** — 完整入门指南
## 相关原型
| 原型 | 最适合 |
|-----------|----------|
| **[Worker](https://github.com/aget-framework/template-worker-aget)** | 任务执行 |
| **[Developer](https://github.com/aget-framework/template-developer-aget)** | 代码和构建流程 |
| **[Supervisor](https://github.com/aget-framework/template-supervisor-aget)** | Fleet 协调 |
**AGET Framework** | Apache 2.0 | [Issues](https://github.com/aget-framework/template-operator-aget/issues)
标签:Incident Response, Operator, Playbook, SRE, 事故管理, 企业级AI, 偏差过滤, 分类分级, 工作流自动化, 影响评估, 故障排查, 服务连续性, 知识捕获, 站点可靠性工程, 系统健康监控, 运维模板, 运维自动化, 运营可靠性, 运行手册, 逆向工具