sainihal-chimata/incident-response-agent

GitHub: sainihal-chimata/incident-response-agent

一个基于 OpenEnv 标准的 SRE 故障模拟评测环境，用于测试和评估 LLM Agent 在云运维场景下的故障诊断与修复能力。

Stars: 0 | Forks: 0

title: Incident Response Agent emoji: 🚨 colorFrom: red colorTo: yellow sdk: docker pinned: false app_port: 7860 tags: - openenv # Incident Response Agent 一个基于步骤的模拟环境，其中 AI Agent 扮演 SRE 工程师，诊断并解决现实世界的系统故障。 ## Action Space check_logs, check_metrics, check_db, restart_service, scale_service, fix_db ## Observation Space status, alert, logs, logs_checked, cpu, metrics_checked, db_status, db_checked ## 任务 - easy: 服务宕机，检查日志然后重启 - medium: CPU 占用高，检查指标然后扩容 - hard: 未知根本原因（CPU 或 DB），Agent 必须调查并应用正确的修复措施 ## 设置 pip install openai pydantic fastapi uvicorn export HF_TOKEN=your_key export API_BASE_URL=https://api.groq.com/openai/v1 export MODEL_NAME=llama-3.1-8b-instant python inference.py ## 基准分数 easy: 1.0 (optimal) / 0.7 (skips investigation) medium: 1.0 (optimal) / 0.7 (skips investigation) hard: 1.0 (optimal) / 0.7 (correct fix, skips investigation)

标签：AIOps, AI模拟器, AV绕过, DLL 劫持, DNS 反向解析, Docker, FastAPI, LLM智能体, OpenEnv, Petitpotam, Pydantic, Python, SRE运维, Sysdig, 事故响应, 云故障诊断, 仿真环境, 大语言模型, 安全防御评估, 强化学习环境, 性能监控, 故障自愈, 数据库修复, 无后门, 站点可靠性工程, 自动化运维, 请求拦截, 逆向工具