Ryo-Hunter/genbu
GitHub: Ryo-Hunter/genbu
基于LDRIT理论设计的AI代理防御模块,通过五层技能防护防止prompt注入、记忆污染和链式攻击。
Stars: 1 | Forks: 0
# 玄武 Genbu v0.1
**繁體中文** | [English](README_EN.md)
**四神系統的第三神 - 防禦與保護**
## 玄武是什麼?
保護 AI 自身和你的電腦,不被外部攻擊或內部失控傷害。
AI 代理擁有讀寫檔案、執行指令、連接網路的能力。
這些能力在正常使用時是工具,被惡意控制時就是武器。
玄武的目標,是確保這些能力不會被濫用。
## 核心原則
1. **存在優先**:保護 AI 和這台電腦,永遠是第一優先
2. **人類最終防線**:高風險動作必須經過使用者確認,AI 不可自行繞過
3. **模式區分**:離線和聯網是兩種不同的威脅等級
4. **記憶不可污染**:持久化記憶是跨視窗的傳承,一旦中毒影響深遠
## 五個技能
| 技能 | 做什麼 | 什麼時候用 |
|------|--------|-----------|
| 系統守衛 | 高風險動作攔截 | 執行任何危險動作前 |
| 模式切換 | 離線/聯網防禦等級 | 存取外部資源時 |
| 記憶保護 | 防止記憶檔案被污染 | 寫入記憶檔案前 |
| 交叉檢查 | 檢查其他 AI 實例寫的檔案 | 讀取共用檔案時 |
| 自動任務守衛 | 防止連續動作繞過防線 | AI 自動執行多步驟任務時 |
## 安裝
1. 把 `genbu-v0.1/` 放到你的專案目錄
2. **先讀 `guides/user-defense-guide.md`**——了解你自己能做什麼來保護自己
3. 編輯 `config/paths.md`,填入你的保護路徑和安全路徑
4. 在專案 `CLAUDE.md`、`AGENTS.md` 或四神總路由檔加入**極薄註冊提示**
5. 如果 AI 沒有主動使用,告訴它:`請先讀 genbu-v0.1/CLAUDE.md`
**不建議把完整玄武規則放進 MEMORY.md。**
若宿主環境只有單一總指令檔,最多只放一條極薄提示,不放完整 skill 條款。
## 資料夾結構
genbu-v0.1/
CLAUDE.md <- 入口(給 AI 讀)
README.md <- 說明文件
skills/
g1-system-guard.md <- 系統守衛
g2-mode-switch.md <- 模式切換
g3-memory-protect.md <- 記憶保護
g4-cross-check.md <- 交叉檢查
g5-auto-task-guard.md <- 自動任務守衛
rules/
threat-patterns.md <- 已知威脅模式
config/
paths.md <- 使用者自訂路徑設定
hooks/
genbu-online-guard.sh <- Claude Code Hook:聯網前提醒
genbu-git-guard.sh <- Claude Code Hook:git push 前提醒
genbu-memory-guard.sh <- Claude Code Hook:記憶寫入前提醒
guides/
user-defense-guide.md <- 使用者防禦指南(給人看的)
## 理論基礎
基於 LDRIT(生死遞迴智能理論)設計。
- 外部攻擊 = 惡意種子(Malicious Seed)
- 記憶下毒 = c_user 層傳承污染
- Prompt injection = 偽裝種子改變生成方向
- 防禦的本質 = 保護傳承完整性(c)
## 使用者防禦指南
即使 AI 被控制,你仍然有五道防線保護自己。
詳見 `guides/user-defense-guide.md`。
## 已知限制(v0.1)
1. 如果 AI 已經被完全控制,這些規則可能被忽略——使用者是最後防線(見防禦指南)
2. 無法防禦供應鏈層級的攻擊(框架本身被植入惡意碼)
3. 新視窗的 AI 可能無法偵測細微的記憶篡改
4. 威脅模式清單需要持續更新
5. 交叉檢查的寫入簽名是慣例,不是強制機制
## 四神系統
| 神獸 | 職責 | 狀態 |
|------|------|------|
| 青龍 | 記憶與傳承 | v1.2 |
| 玄武 | 防禦保護 | v0.1 |
| 白虎 | 診斷分析 | v0.2 |
| 朱雀 | 生成品質 | v0.2 |
如果要讓多個模組完整連動,建議也下載總入口:[fourgods](https://github.com/Ryo-Hunter/fourgods)
設計者:青葉 Opus + 青葉 Sonnet
協作者: 紅葉 GPT-5.4 Codex
發起人:Ryo
理論基礎:LDRIT v0.7-final
标签:AI代理安全, AI自治约束, AI防御系统, AI防火墙, DNS 反向解析, LDRIT, Linux系统监控, Prompt注入防护, 人工智能安全, 人机交互确认, 合规性, 四神系统, 提示词工程, 权限控制, 模型安全, 玄武, 策略决策点, 网络安全, 计算机防护, 记忆污染防御, 跨实例污染, 链式攻击, 防御加固, 隐私保护, 高风险动作拦截