hira299/sentinel-mesh

GitHub: hira299/sentinel-mesh

神经符号框架，结合LLM与Z3 SMT形式化验证实现云基础设施配置错误的自动闭环修复。

Stars: 0 | Forks: 1

# Sentinel-Mesh 神经符号框架，用于自动修复云基础设施配置错误。将 LLM 驱动的补丁生成与 Z3 SMT 形式化验证结合在闭环反馈中。 ### 技术资源要深入了解 Cloud Perimeter Model 和本框架中使用的 SMT 逻辑，请阅读 Medium 上的文章： **[超越启发式：使用 Z3 SMT 求解器形式化验证 AI 生成的基础设施](https://medium.com/@hira229922/beyond-heuristics-formally-verifying-ai-generated-infrastructure-with-z3-smt-solvers-e95fd3a7bf95)** ## 工作原理 1. 检测到 Terraform 配置错误并传递给 LLM 代理 2. 代理生成修复补丁 3. Z3 验证器根据形式化安全不变量（Cloud Perimeter Model）检查补丁 4. 如果补丁验证失败，Z3 错误消息将反馈给 LLM 并重试循环 5. 一旦补丁满足所有不变量，即被接受。对于加密和网络违规问题，还通过双求解器 Z3 细化（求解器 A 用于完整性，求解器 B 用于正确性）颁发形式化证明证书 — 基准测试中 37/88 个修复案例获得了证书验证器充当闭环接受 oracle。LLM 无法在不满足形式化约束的情况下生成通过验证的补丁。 ## 基准测试结果在 8 个云基础设施领域的 105 个手工制作的 Terraform 配置错误基准案例上进行了评估。 fig1_ieee

| 指标 | 结果 | |---|---| | 总体修复率 | 88/105 (83.81%) | | 单次解决率 | 85.23% (75/88 在 k=1 时) | | 颁发的形式化证明证书 | 37 (29 个 FPC + 8 个 PATCH REJECTED) | | LLM 幻觉率 | 16.19% (17/105) | | 阻止的幻觉补丁 | 17/17（0% 回退率） | | 每个修复案例的平均尝试次数 | μ=1.27，σ=0.74 | ### 按领域分类 | 领域 | 案例数 | 修复数 | 率 | |---|---|---|---| | Identity | 9 | 9 | 100% | | Management | 6 | 6 | 100% | | Database | 17 | 16 | 94.1% | | Networking | 15 | 14 | 93.3% | | Security | 12 | 11 | 91.7% | | Compute | 23 | 17 | 73.9% | | Analytics | 13 | 9 | 69.2% | | Storage | 10 | 6 | 60.0% | fig5_ieee

## 设置 ``` git clone https://github.com/hira299/sentinel-mesh cd sentinel-mesh make install ``` 将 `.env.example` 复制到 `.env` 并添加您的 API 密钥： ``` CEREBRAS_API_KEY=... GEMINI_API_KEY=... GROQ_API_KEY=... ``` ## 使用方法 ``` # Run full benchmark make benchmark # Generate result figures make visualize # Single file run make run ``` 结果写入 `logs/research_data_v100.csv`。图表保存到 `logs/`。 ## 项目结构 ``` sentinel-mesh/ ├── benchmark/ │ └── test_cases/ # 105 Terraform misconfiguration test cases ├── core/ │ ├── verifier.py # Z3 SMT verifier and Cloud Perimeter Model (2,591 lines) │ ├── orchestrator.py # closed-loop remediation orchestrator (MAX_RETRIES=3) │ └── llm_agent.py # LLM patch generation agent (Cerebras/Gemini/Groq rotation) ├── parsers/ │ └── hcl_to_json.py # Terraform HCL parser ├── experiment_runner.py # batch benchmark runner (uses k=5 retries) ├── visualizer.py # result figure generation ├── logs/ # generated outputs (gitignored) ├── Makefile └── requirements.txt ``` ## 依赖项 - Python 3.10+ - z3-solver - python-hcl2 - matplotlib - cerebras-cloud-sdk - 完整列表请参见 `requirements.txt` ## 引用如果您使用此工作，请引用： ``` @misc{sentinelmesh2026, title = {Sentinel-Mesh: Neuro-Symbolic Autonomous Remediation of Cloud Misconfigurations}, author = {Hira Ahmed}, year = {2026}, url = {https://github.com/hira299/sentinel-mesh} } ``` ## 许可证 MIT

标签：C2, CloudPerimeterModel, DLL 劫持, EC2, ECS, IaC, LLM, SMT求解器, Sysdig, Terraform, Unmanaged PE, Vagrant, Z3, 云基础设施, 双求解器验证, 反馈循环, 合规检测, 大语言模型, 安全不变量, 形式化方法, 形式化验证, 神经符号AI, 自动修复, 自动化运维, 证明证书, 逆向工具, 配置修复, 错误修复