Ibraheemolasupogit/azure-enterprise-security-intelligence-platform

GitHub: Ibraheemolasupogit/azure-enterprise-security-intelligence-platform

一个本地模拟的 Azure 企业安全分析平台，通过合成数据演示遥测接入、威胁检测、身份治理、风险评分和 GenAI 调查的完整安全运营工作流。

Stars: 0 | Forks: 0

# Azure 企业安全智能平台这是一个生产级的 Azure 安全分析与 AI 平台，用于模拟企业遥测数据的接入、身份治理、威胁检测、安全态势监控、合规证据、仪表盘报告以及本地 GenAI 风格的安全调查工作流。 ## 概述 Azure 企业安全智能平台是一个本地优先的项目组合，专注于企业安全分析和云安全架构。它使用确定性的合成数据来模拟安全遥测数据如何通过接入、验证、检测工程、身份治理、风险评分、运营证据、仪表盘导出以及未来的 AI 辅助调查工作流进行流转。该项目在设计上保证了本地运行的安全性。它不会连接到 Azure，不会部署云资源，不会使用真实用户或凭据，也不会调用 Azure OpenAI、Azure AI Foundry、OpenAI、Microsoft Graph、Defender XDR、Sentinel 或 Power BI API。 ## 架构概述 ``` flowchart LR Telemetry["Synthetic Telemetry"] --> Ingestion["Ingestion"] Ingestion --> Validation["Validation"] Validation --> Detections["Detections"] Validation --> Identity["Identity Governance"] Detections --> Risk["Risk Scoring"] Identity --> Risk Risk --> Monitoring["Monitoring Evidence"] Monitoring --> Copilot["Local Copilot Simulation"] Copilot --> Dashboards["Dashboard Exports"] Dashboards --> AzureDesign["Azure Architecture Design"] ``` 本地架构借鉴了生产环境的安全分析模式，同时确保每一个步骤都是透明、可测试且可重现的。 ## 业务问题企业安全团队经常需要在各种互不连通的工具中开展工作，面临遥测数据碎片化、重复告警、身份治理薄弱以及调查工作流缓慢等问题。合规证据和高管报告可能需要从多个系统手动收集数据。AI 辅助调查可以提供帮助，但它首先需要干净的遥测数据、可追溯的证据、受治理的身份信号以及清晰的运营模型。该项目通过映射到 Microsoft 安全和 Azure 架构概念的本地实现，展示了这一基础能力。 ## 目标用户 - SOC 分析师和 SOC 分析工程师 - 安全工程师和云安全工程师 - 身份工程师和 Zero Trust 治理团队 - 安全架构师和网络安全负责人 - 安全数据科学家和 AI 工程师 - 风险、合规和高管报告团队 ## 核心能力 - 确定性的合成安全遥测生成 - 将原始 JSONL 数据接入并处理为 CSV 数据集 - 数据质量验证和证据报告 - 带有 MITRE ATT&CK 映射的确定性威胁检测规则 - 针对 MFA 漏洞、来宾暴露、特权访问和角色蔓延的身份治理检查 - 可解释的实体风险评分 - 运营健康监控和证据清单生成 - 本地模拟的 GenAI 风格调查摘要和修复计划 - 适用于 Power BI、Streamlit 和报告工作流的仪表盘就绪 CSV 导出 - Azure 架构和部署设计文档及安全的 IaC 骨架 - Pytest 和 Ruff 质量关卡 ## Azure 服务映射 | 平台领域 | Azure 对齐 | 用途 | | --- | --- | --- | | 遥测接入 | Microsoft Sentinel、Azure Monitor、Event Hub、Log Analytics | 收集并标准化安全事件。 | | 身份治理 | Microsoft Entra ID、Entra ID Governance、Conditional Access、PIM | 支持 Zero Trust 访问审查和特权访问治理。 | | 端点和云安全 | Microsoft Defender XDR、Defender for Endpoint、Defender for Cloud | 建模端点、事件和云安全态势信号。 | | 数据和分析 | Azure Data Lake Storage、Azure Data Explorer、Microsoft Fabric、Power BI | 存储、查询和报告安全智能数据集。 | | 风险评分 | Azure Data Explorer、Azure Machine Learning | 目前提供可解释的评分，并为未来的 ML 就绪提供支持。 | | 调查协助 | Azure AI Foundry、Azure OpenAI、Azure AI Search | 在本地代表未来受治理的调查和 RAG 工作流。 | | 治理和机密 | Azure Key Vault、Managed Identity、RBAC、Azure Policy、Microsoft Purview | 映射到安全的生产控制措施，无需在本地存储机密。 | | 监控和报告 | Azure Monitor、Application Insights、Sentinel workbooks、Power BI | 支持运营可视性和高管报告。 | ## 本地优先实现说明本仓库是一个本地模拟和架构设计项目。它仅使用人工遥测数据和本地输出。`infra/` 下的基础设施文件是用于项目组合文档的参考骨架，不能将其视为可用于生产环境的部署模板。 ## 端到端工作流 1. 在 `data/raw/` 中生成合成遥测数据。 2. 将原始 JSONL 文件接入到 `data/processed/` 中的已处理 CSV 文件中。 3. 验证已处理的数据集并生成数据质量证据。 4. 运行确定性威胁检测。 5. 运行身份治理检查。 6. 按风险对用户、设备和资源进行评分。 7. 生成运营健康和证据产出物。 8. 生成本地模拟的 GenAI 风格调查简报。 9. 导出适配仪表盘的 CSV 数据集。 10. 审查 Azure 生产架构和部署设计产出物。 ## 快速开始 ``` python3 -m venv .venv source .venv/bin/activate python -m pip install -e ".[dev]" python -m pytest python -m ruff check . python -m security_intelligence.cli health-check ``` 运行完整的本地工作流： ``` bash scripts/run_all_local.sh ``` 有关分步演示，请参见 [LOCAL_DEMO.md](LOCAL_DEMO.md)。 ## CLI 命令参考 | 命令 | 用途 | | --- | --- | | `health-check` | 确认本地脚手架已就绪。 | | `show-config` | 打印解析后的平台配置。 | | `generate-telemetry` | 生成合成的 JSONL 遥测数据。 | | `ingest-telemetry` | 将原始的 JSONL 遥测数据转换为已处理的 CSV 数据集。 | | `validate-telemetry` | 验证已处理的遥测数据并生成质量证据。 | | `run-detections` | 运行确定性威胁检测规则。 | | `run-identity-checks` | 运行身份治理分析。 | | `score-risk` | 生成可解释的实体风险评分。 | | `monitor-platform` | 生成运营健康和证据输出。 | | `generate-copilot-briefs` | 生成本地模拟的 GenAI 风格调查报告。 | | `export-dashboard-data` | 导出适配仪表盘的 CSV 数据集和摘要元数据。 | 完整详情记录在 [docs/cli_reference.md](docs/cli_reference.md) 中。 ## 生成的输出主要输出组包括： - `data/raw/*.jsonl`：合成的原始遥测数据 - `data/processed/*.csv`：处理后的遥测数据集 - `outputs/*.json`：接入、验证、发现、风险、监控、证据和 copilot 上下文 - `outputs/*.csv`：身份审查和风险评分表 - `reports/*.md`：人类可读的证据、发现、治理、风险、运营和 copilot 报告 - `dashboards/exports/*.csv`：适配仪表盘的导出文件 - `dashboards/dashboard_summary.json`：仪表盘导出摘要有关完整的输出目录，请参见 [docs/output_catalog.md](docs/output_catalog.md)。 ## 仪表盘导出里程碑 10 生成适配仪表盘的 CSV 文件，可用于 Power BI 导入、Streamlit 原型设计、电子表格审查、SOC 报告、治理仪表盘和高管报告： - `dashboards/exports/security_findings_dashboard.csv` - `dashboards/exports/identity_governance_dashboard.csv` - `dashboards/exports/risk_scores_dashboard.csv` - `dashboards/exports/operational_health_dashboard.csv` - `dashboards/exports/executive_summary_metrics.csv` - `dashboards/exports/evidence_manifest_dashboard.csv` 可选的 [dashboards/streamlit_app.py](dashboards/streamlit_app.py) 会在安装了 Streamlit 时读取这些导出文件，但测试时不需要 Streamlit。 ## Copilot 模拟输出本地 copilot 层模拟 Azure AI Foundry 或 Security Copilot 风格的工作流，且不会调用任何外部服务。它生成： - `outputs/copilot_context.json` - `reports/copilot_investigation_summary.md` - `reports/copilot_soc_triage_note.md` - `reports/copilot_executive_brief.md` - `reports/copilot_remediation_plan.md` - `reports/copilot_compliance_evidence_summary.md` 生成的每份报告都会注明，它是基于合成平台输出的本地模拟 GenAI 风格响应。 ## 架构和部署设计生产映射和部署规划产出物： - [infra/README.md](infra/README.md) - [infra/azure_architecture.md](infra/azure_architecture.md) - [infra/deployment_plan.md](infra/deployment_plan.md) - [infra/security_controls.md](infra/security_controls.md) - [infra/cost_considerations.md](infra/cost_considerations.md) - [infra/environments.md](infra/environments.md) - [docs/architecture.md](docs/architecture.md) - [docs/production_architecture.md](docs/production_architecture.md) - [docs/security_operations_model.md](docs/security_operations_model.md) - [diagrams/azure_architecture.mmd](diagrams/azure_architecture.mmd) - [diagrams/data_flow.mmd](diagrams/data_flow.mmd) - [diagrams/security_operations_flow.mmd](diagrams/security_operations_flow.mmd) ## 仓库结构 ``` configs/ Platform, detection, and compliance configuration data/ Raw, processed, and sample local data folders dashboards/ Dashboard exports, summary, and optional Streamlit placeholder diagrams/ Mermaid architecture and operations diagrams docs/ Architecture, operations, CLI, outputs, testing, and limitations docs infra/ Azure reference architecture and safe IaC skeletons notebooks/ Reserved for future local exploration outputs/ Machine-readable pipeline outputs reports/ Human-readable Markdown reports scripts/ Local verification scripts src/security_intelligence/ Python package and CLI implementation tests/ Pytest coverage by platform layer ``` ## 测试和质量检查 ``` python -m pytest python -m ruff check . ``` 测试套件使用确定性的合成数据和本地临时目录。它不需要 Azure CLI、Terraform、Bicep CLI、云凭据、付费服务或网络访问。有关测试详情，请参见 [docs/testing_strategy.md](docs/testing_strategy.md)。 ## 作品集定位该项目展示了安全数据工程、检测工程、身份治理分析、Zero Trust 思维、确定性风险评分、运营证据生成、适配仪表盘的报告、本地 GenAI 风格的调查工作流、Azure 架构映射、基础设施即代码设计意识以及质量自动化。它适合涉及云安全工程、SOC 分析工程、网络安全架构、安全数据科学、AI 工程以及受监管环境下的数据/ML 工程的职位。有关简明的项目叙述，请参见 [PROJECT_WALKTHROUGH.md](PROJECT_WALKTHROUGH.md) 和 [PORTFOLIO_SUMMARY.md](PORTFOLIO_SUMMARY.md)。 ## 里程碑状态 | 里程碑 | 名称 | 状态 | | --- | --- | --- | | 1 | 脚手架 | 已完成 | | 2 | 合成遥测数据 | 已完成 | | 3 | 接入管道 | 已完成 | | 4 | 验证和数据质量 | 已完成 | | 5 | 威胁检测规则 | 已完成 | | 6 | 身份治理检查 | 已完成 | | 7 | 风险评分和分析 | 已完成 | | 8 | 监控和运营证据 | 已完成 | | 9 | GenAI 安全调查 copilot | 已完成 | | 10 | 仪表盘和报告导出 | 已完成 | | 11 | Azure 架构和部署设计 | 已完成 | | 12 | 作品集润色 | 已完成 | ## 限制和未来工作该平台仅使用合成数据，没有实时的 Azure 部署，不包含真实的 Sentinel、Microsoft Graph、Defender XDR 或 Power BI 集成，并使用确定性评分而不是训练过的 ML。Copilot 层是一个本地模拟，Terraform/Bicep 文件仅作为参考骨架。未来工作记录在 [docs/limitations_and_future_work.md](docs/limitations_and_future_work.md) 中。

标签：AI调查, AMSI绕过, Azure, Kubernetes, 合成数据模拟, 威胁检测, 安全态势, 安全运营, 扫描框架, 文档结构分析, 时序数据库, 逆向工具