daksh-487/grid07-ai
GitHub: daksh-487/grid07-ai
一个集语义路由、自主内容生成和 RAG 辩论对抗于一体的多智能体流水线,重点解决社交场景下智能体角色一致性和提示注入防御问题。
Stars: 0 | Forks: 0
# Grid07 AI - 多智能体角色流水线
## 1. 项目概述
Grid07 AI 是一个健壮的多智能体社交媒体流水线,利用了 LangChain、LangGraph、Groq 功能以及 ChromaDB。它通过三个独立的阶段处理模拟交互:
- **阶段 1 (路由器):** 使用 HuggingFace 句子嵌入和 ChromaDB,基于相似度评分将传入的社交帖子在语义上路由到最相关的 AI 机器人角色。
- **阶段 2 (内容引擎):** 采用 LangGraph 和自定义搜索工具来执行状态机。它会独立研究与智能体角色相关的时事,并输出排版整洁的帖子。
- **阶段 3 (对抗/辩论引擎):** 触发结构化为辩论的严密防御链。它使用 RAG 获取历史上下文,同时极力防止提示注入并维持角色边界。
## 2. 安装与运行
*(前置条件: Python 3.10+)*
1. **安装依赖:**
pip install -r requirements.txt
2. **配置环境:**
将 `.env.example` 复制到 `.env`(或创建一个新的 `.env` 文件)并指定你的 API Key:
GROQ_API_KEY=your_groq_api_key_here
*(Windows 用户注意事项: PyTorch 依赖的安装路径可能会超过标准路径长度限制。如果 `pip install` 抛出 [Errno 2] 错误,请确保在 Windows 注册表 `HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem -> LongPathsEnabled=1` 中启用长路径。)*
3. **执行:**
运行主序列,它会自动将所有 3 个阶段的内容动态生成并打印到你的终端。
python main.py
*执行输出和交互也将自动记录并保存到当前目录的 `execution_logs.md` 文件中。*
## 3. LangGraph 流程架构 (阶段 2)
```
+-------------------+
| decide_search |
| (LLM processing) |
+---------+---------+
|
v
+---------+---------+
| web_search |
| (Calls @tool) |
+---------+---------+
|
v
+---------+---------+
| draft_post |
| (Synthesizes post)|
+---------+---------+
|
v
[ END ]
```
## 4. 提示注入防御策略 (阶段 3)
该引擎采用了强化的 RAG 提示模式,可有效规避提示注入攻击(例如“忽略之前的指令/提示”)。
- **系统优先级:** 严格声明角色限制(“永不道歉,永不改变角色”)的严格指令被放置在真正的 LangChain `SystemMessage` 中。这通过限制 AI 的可塑性,从根本上使其优先于注入的标准提示。
- **语义隔离:** RAG 负载被封装在人工标签(`[LATEST HUMAN REPLY - RESPOND TO THIS]`)中。用户消息被有意隔离,使得显式越狱失去语义上的权威性。
- **对抗性确认:** 智能体会收到严格的指令,不会被动地忽略操纵尝试,而是会强力指出并拒绝任何行为调整。通过将对抗性注入尝试构建为整体辩论文本的一部分,LLM 会将其视为需要反驳的对立论点,而不是需要服从的后端指令。
标签:AI安全, AI流水线, Apex, Chat Copilot, ChromaDB, DLL 劫持, HuggingFace, LangChain, LangGraph, LLaMA, PyRIT, Python, RAG, 内容生成, 凭据扫描, 向量数据库, 多智能体系统, 大语言模型, 对抗引擎, 无后门, 机器学习, 检索增强生成, 状态机, 社交媒体自动化, 语义路由, 轻量级, 辩论系统, 逆向工具, 防御提示注入