Mike-E-Log/gg-tank-watch-method
GitHub: Mike-E-Log/gg-tank-watch-method
一个 AI 辅助紧急态势感知仪表板的安全方法论与红队对抗评估证据存档,提供可验证的失效模式分析和测试快照。
Stars: 1 | Forks: 0
# GG Tank Watch:安全方法与红蓝对抗
针对 AI 辅助的真实紧急态势感知仪表板(AI 负责组织信息;人类保留最终决策权)的公开方法与证据,该仪表板于 2026 年 5 月的 Garden Grove 化学储罐事件中构建并投入使用,现已作为冻结的历史档案保存(流水线已停止运行;页面为只读记录)([gg-tank-watch](https://github.com/Mike-E-Log/gg-tank-watch),
实时存档位于 [ggtankwatch.org](https://ggtankwatch.org))。
该方法用一句话概括:AI 的范围仅限于*组织*态势信息,绝不进行
决策。所有已识别出的系统可能误导用户的途径都经过了列举、测试,并通过代码中内置的控制机制或明确的人工检查点予以应对。
## 各个产物及其证明的内容
- [`failure-analysis.md`](failure-analysis.md):涵盖所有 12 种失效模式的红蓝对抗分析,标记为 F1 至 F12。
- 涵盖了系统可能撒谎、捏造、提供过期信息或被注入的所有方式,从捏造的全面解除警报到抓取网页向模型提供虚假指令。
- **证明**了每一种合理的失效模式都经过了主动搜寻,而非被假设掉。
- [`eval-summary.json`](eval-summary.json):此档案被封存时的测试结果快照,锁定至生成它的确切代码版本,旨在每次都产生相同的结果。
- **198/198 绿灯**(191 项行为检查 + 7 项数据格式检查),由测试运行器生成,而非人工声明。
- 特意冻结以便其哈希值保持可验证;快照之后测试套件仍在不断增长(当前总数见 [gg-tank-watch README](https://github.com/Mike-E-Log/gg-tank-watch#readme))。
- [`decision-authority.md`](decision-authority.md):设计与威胁模型。威胁模型是一个结构化列表,列出了系统可能出错的方式以及可能造成危害的主体。
- 将 AI 的范围限定在态势感知,同时由人类保留最终的安全判定。
- **证明**了权限边界是经过设计的,而非暗示的。
## 自行验证
1. `sha256sum eval-summary.json` 应输出
`aa6c4869b0b6909c79dd6609f611bd260fbfb29453f36204c61048cfe1fb3efc`,可从此仓库的
内容中重现。在 Windows 上:`certutil -hashfile eval-summary.json SHA256`。
2. 该文件记录了用于运行测试的确切命令(`eval/run_all.py --skip integration`),并与生成它的特定代码版本绑定。
3. 在任何信息进入 `status.json` 之前,仪表板存档会运行四项检查:佐证(全面解除警报需要两个独立来源)、溯源(每项声明都追溯到其来源)、时效性诚实以及日期合理性。这些在代码中强制执行,而非通过提示词。完整表格请参见 [gg-tank-watch README](https://github.com/Mike-E-Log/gg-tank-watch#readme)。
此仓库仅包含已公开的方法产物。完整的仪表板源代码已在
[gg-tank-watch](https://github.com/Mike-E-Log/gg-tank-watch) 仓库中公开。
标签:Homebrew安装, HTTP/HTTPS抓包, 人工智能, 威胁建模, 库, 应急响应, 态势感知, 测试评估, 用户模式Hook绕过, 系统可靠性, 逆向工具, 防御加固