10DownPro/ai-incident-command-center
GitHub: 10DownPro/ai-incident-command-center
基于ServiceNow平台的AI驱动IT事件响应助手,一键触发OpenAI分析并推送Slack通知,帮助企业运维团队加速事件处理和沟通流程。
Stars: 0 | Forks: 0
# AI 事件指挥中心
一个定制的 ServiceNow 限定域应用程序,利用 AI 驱动的建议和实时 Slack 通知来自动化 IT 事件分析。该项目旨在模拟现代企业运维团队如何大规模处理关键事件。
该项目将限定域应用程序开发、REST API 集成、AI 辅助自动化和跨平台警报整合到一个完整的工作流中。
## 为什么构建这个项目
企业事件响应是速度和清晰度比任何事物都更重要的领域之一。分析师浪费时间撰写摘要、判断严重程度以及联系利益相关者。我希望构建一个能够自动处理重复性工作的工具,让团队可以专注于真正解决问题。
该项目反映了我在企业环境中亲身经历和实施的真实模式,特别是在事件管理、跨团队沟通和运维工作流方面。
## 功能说明
该应用程序允许分析师创建事件记录,并通过单击按钮运行 AI 驱动的分析。一旦触发,系统会生成完整的事件分析报告,并将格式化的警报直接推送到 Slack。
以下是用户点击“Run AI Analysis”时发生的流程:
1. UI Action 在服务器端触发 Script Include
2. Script Include 使用 GlideRecord 提取事件数据
3. 通过 RESTMessageV2 向 OpenAI Chat Completions API 发出 REST 调用
4. 解析 AI 响应并将其写回事件记录
5. 发送包含事件详细信息和 AI 生成的摘要的 Slack 通知
每次分析都会在记录中填充以下内容:
- AI 生成的事件摘要
- 建议的严重等级
- 可能的根本原因
- 建议的修复步骤
- 利益相关者沟通更新

## 系统架构
```
Incident Record
|
v
UI Action ("Run AI Analysis")
|
v
Script Include (Server-Side)
|
v
OpenAI REST API (Chat Completions)
|
v
AI Response Parsing + Record Update
|
v
Slack Webhook Notification
```
整个流程在 ServiceNow 限定域应用程序内于服务器端运行。无需客户端脚本或外部 middleware。
## 自定义表:AI Incident Analysis
该应用程序使用专门的自定义表来同时跟踪事件详细信息和 AI 输出。
| 字段 | 用途 |
|---|---|
| Incident Number | 自动编号的唯一标识符 |
| Incident Description | 问题的自由文本描述 |
| Affected System | 受影响的系统或服务 |
| Current Severity | 分析师分配的严重等级 |
| AI Status | 跟踪是否已运行分析 |
| AI Recommended Severity | 基于分析由 AI 建议的严重等级 |
| AI Summary | AI 生成的运维摘要 |
| Likely Root Cause | AI 识别的可能原因 |
| Remediation Steps | AI 建议的修复操作 |
| Stakeholder Update | AI 为管理层起草的沟通内容 |
| Slack Sent | 用于通知状态的布尔标志 |
| Analysis Timestamp | 执行分析的时间 |


## OpenAI 集成
该集成使用 ServiceNow REST Messages 构建,配置如下:
- **Endpoint:** OpenAI Chat Completions API
- **Method:** HTTP POST
- **Auth:** 通过请求头传递 API key
- **Request Body:** 在运行时注入动态事件变量的 JSON payload
- **Response Handling:** 解析 JSON 并映射回事件记录字段
REST Message、请求头、身份验证、请求体结构和响应解析均已完全实现。在开发过程中,实际的 API 调用被模拟化处理,以避免产生付费使用,同时仍然验证了完整的端到端集成架构。


## Slack 集成
分析完成后,使用 Incoming Webhook 自动触发格式化的 Slack 警报。消息内容包括:
- 事件编号
- 分析时间戳
- 严重等级
- AI 生成的摘要
- 利益相关者更新
这反映了真实的企业运维团队如何将关键事件更新推送到作战室(war rooms)和管理层频道。


## UI Action
“Run AI Analysis”按钮被配置为事件表单上的服务器端 UI Action。只需点击一下即可触发完整的 pipeline:AI 分析、记录更新和 Slack 通知。


## 示例记录
## 
## 技术栈
| 技术 | 用途 |
|---|---|
| ServiceNow | 平台、限定域应用程序、自定义表、UI Actions |
| JavaScript | 所有服务器端脚本 |
| GlideRecord | 数据库查询和记录操作 |
| RESTMessageV2 | 向 OpenAI 和 Slack 发出出站 REST 调用 |
| OpenAI API | AI 驱动的事件分析 |
| Slack Webhooks | 实时通知交付 |
| JSON | 请求/响应格式化和解析 |
## 其他配置细节
除核心功能外,该应用程序还包括:
- 具有适当 HTTP 方法、自定义请求头和结构化请求体的 REST Message 设置
- 用于 Slack 的 Webhook 集成配置
- 事件记录的自动编号
- 用于严重程度、状态和 AI 分析状态的自定义选项字段
- 用于跟踪进展的事件状态工作流逻辑
## 未来改进
- 为未使用 Slack 的组织提供 Microsoft Teams 集成
- 基于 AI 建议的严重程度进行自动升级
- CMDB 关系映射,将事件与受影响的配置项关联
- 跨过往事件的历史趋势分析
- AI 置信度评分,用于标记低确定性的建议
- 从已解决的事件自动生成知识库文章
- ServiceNow Virtual Agent 集成,用于自助分类
## 项目展示
这不是一个教程演练或复制粘贴的演示。它是一个能够反映真实企业模式且正常运行的限定域应用程序:
- **ServiceNow 开发:** 限定域应用程序、自定义表、Script Includes、UI Actions、GlideRecord
- **API 集成:** RESTMessageV2、HTTP 方法、JSON 处理、动态 payloads
- **AI 自动化:** 结构化的 AI 提示、响应解析、字段映射
- **运维工作流:** 事件管理、严重等级分类、利益相关者沟通
- **跨平台警报:** Slack webhooks、格式化通知、实时交付
## 作者
**T'Vedt Lazenby**
系统管理员 | AI + 自动化工程师
Tech Teens Inc. 创始人
[LinkedIn](https://linkedin.com/in/YOUR-URL) | [GitHub](https://github.com/YOUR-URL)
标签:AIOps, AI摘要生成, AI辅助运维, ChatGPT, GlideRecord, Homebrew安装, ITSM, IT事件响应, IT服务管理, OpenAI, Petitpotam, Promptflow, REST API集成, RESTMessageV2, ServiceNow, Slack集成, 严重性评估, 事件分析, 事件指挥系统, 事件管理, 企业IM告警, 企业IT自动化, 企业级IT运维, 企业级软件, 修复建议, 内存规避, 利益相关者通知, 数据可视化, 无服务器运维, 智能客服, 智能指挥中心, 智能运维助手, 根因分析, 脚本开发, 自动化分析, 跨平台集成, 跨站脚本