erangaKavisanka/sre-system-auditor

GitHub: erangaKavisanka/sre-system-auditor

一个基于 Bash 的轻量级 Linux 监控代理,能够自动采集系统指标并执行安全审计,通过 Slack 实时推送运维报告。

Stars: 1 | Forks: 0

# 强化版 SRE 监控与安全审计代理 这是一个轻量级的站点可靠性工程(SRE)自动化解决方案,使用 Bash 脚本构建,能够执行自动化的 Linux 系统审计和安全检查,并通过 ChatOps 集成将运维报告直接发送到 Slack。 ## 高层架构

High Level Architecture

强化版 SRE 监控与安全审计代理的端到端工作流。

## 概述 现代基础设施需要持续的监控、运维可见性和安全意识。手动服务器检查耗时、不一致且难以扩展。 该项目通过收集关键系统指标、执行以安全为核心的检查、生成运维报告,并使用 Incoming Webhooks 直接向 Slack 发送实时通知,从而实现基础设施审计的自动化。 该解决方案展示了核心的站点可靠性工程(SRE)、DevOps 和 DevSecOps 概念,同时促进了自动化和卓越运营。 ## 详细架构

Detailed Architecture

展示监控组件、安全审计模块、报告生成和基于 Slack 的 ChatOps 集成的详细架构。

## 核心功能 ### 基础设施健康监控 - CPU 使用率监控 - 内存使用率监控 - 磁盘使用情况监控 - 主机名收集 - 带时间戳的审计报告 ### 网络审计 - 开放端口检测 - 监听服务识别 - 网络暴露可见性 ### 存储分析 - 大型日志文件发现 - 磁盘消耗审计 - 日志增长可见性 ### 安全审计 - 失败的 SSH 登录检测 - 身份验证监控 - 基础安全取证 ### ChatOps 集成 - Slack Incoming Webhook 集成 - 自动化通知 - 实时运维报告 - 团队全局可见性 ### 安全的配置管理 - 环境变量支持 - 外部化机密管理 - 安全的 Webhook 处理 ## 技术栈 ### 操作系统 - Linux (Ubuntu / CentOS) ### 脚本与自动化 - Bash ### 监控工具 - top - free - df - ss ### 数据处理 - awk - grep - sed - xargs ### 通信 - Slack Incoming Webhooks - curl ### 配置 - 环境变量 - .env 文件 ## 项目结构 ``` SRE-SYSTEM-AUDITOR │ ├── images │ ├── highlevel.png │ └── architecture.png │ ├── screenshots │ ├── image.png │ ├── 2.png │ └── slack_ss.png │ ├── hardened_audit.sh ├── .gitignore └── README.md ``` ## 工作流 1. Bash 监控代理在 Linux 服务器上执行。 2. 收集系统指标。 3. 执行安全审计。 4. 汇总审计信息。 5. 生成结构化的 JSON payload。 6. 通过安全的 Webhook 将 payload 发送到 Slack。 7. 运维和 SRE 团队可实时了解系统健康状况和安全状态。 ## 收集的指标 | 类别 | 指标 | |-----------|----------| | 计算 | CPU 使用率 | | 计算 | 内存使用率 | | 存储 | 磁盘使用情况 | | 网络 | 开放的监听端口 | | 日志 | 最大的日志文件 | | 安全 | 失败的登录尝试 | | 系统 | 主机名和时间戳 | ## 截图 ### 系统审计执行 监控代理在 Linux 主机上执行自动化的健康检查和安全审计。

System Audit Execution

### 监控与审计结果 收集到的基础设施指标,包括 CPU 使用率、内存利用率、磁盘消耗、开放端口和安全洞察。

Monitoring Results

### Slack ChatOps 通知 生成的审计报告会自动发送到 Slack,为运维和 SRE 团队提供实时可见性。

Slack Notification

## 安全特性 ### 机密管理 Webhook URL 通过环境变量安全存储,而不是硬编码在应用程序中。 ### 身份验证监控 检测失败的 SSH 身份验证尝试,以提高安全可见性。 ### 网络暴露分析 识别活动的监听端口和暴露的服务。 ### 运维审计 生成带时间戳的报告,以支持故障排除和事件调查。 ## 展示的 DevOps、DevSecOps 和 SRE 概念 - 站点可靠性工程(SRE) - 基础设施监控 - 安全审计 - Linux 管理 - Bash 自动化 - ChatOps - 可观测性基础 - DevSecOps 实践 - 卓越运营 - 事件感知 ## 学习成果 该项目提供了以下方面的实践经验: - Linux 内部机制 - 监控自动化 - 安全审计 - 基础设施可靠性 - ChatOps 工作流 - Bash 脚本 - DevOps 工程 - 站点可靠性工程 - DevSecOps 原则 ## 未来改进 - Prometheus Metrics Exporter - Grafana Dashboards - 基于阈值的告警 - 多服务器监控 - Docker 容器化 - Kubernetes 节点审计 - 集中式日志记录 - 自动化事件升级 - 自愈工作流 ## 作者 **Eranga Kavishanka** 软件工程本科生 DevOps | 云计算 | SRE 爱好者 AWS Student Builder Group USJ – 技术负责人 ⭐ 如果您觉得这个项目有趣,欢迎给仓库点 Star 并提供反馈。
标签:Bash, ChatOps, DevSecOps, SRE, 上游代理, 偏差过滤, 应用安全, 运维监控