daksh-487/grid07-ai

GitHub: daksh-487/grid07-ai

一个集语义路由、自主内容生成和 RAG 辩论对抗于一体的多智能体流水线，重点解决社交场景下智能体角色一致性和提示注入防御问题。

Stars: 0 | Forks: 0

# Grid07 AI - 多智能体角色流水线 ## 1. 项目概述 Grid07 AI 是一个健壮的多智能体社交媒体流水线，利用了 LangChain、LangGraph、Groq 功能以及 ChromaDB。它通过三个独立的阶段处理模拟交互： - **阶段 1 (路由器):** 使用 HuggingFace 句子嵌入和 ChromaDB，基于相似度评分将传入的社交帖子在语义上路由到最相关的 AI 机器人角色。 - **阶段 2 (内容引擎):** 采用 LangGraph 和自定义搜索工具来执行状态机。它会独立研究与智能体角色相关的时事，并输出排版整洁的帖子。 - **阶段 3 (对抗/辩论引擎):** 触发结构化为辩论的严密防御链。它使用 RAG 获取历史上下文，同时极力防止提示注入并维持角色边界。 ## 2. 安装与运行 *(前置条件: Python 3.10+)* 1. **安装依赖:** pip install -r requirements.txt 2. **配置环境:** 将 `.env.example` 复制到 `.env`（或创建一个新的 `.env` 文件）并指定你的 API Key： GROQ_API_KEY=your_groq_api_key_here *(Windows 用户注意事项: PyTorch 依赖的安装路径可能会超过标准路径长度限制。如果 `pip install` 抛出 [Errno 2] 错误，请确保在 Windows 注册表 `HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem -> LongPathsEnabled=1` 中启用长路径。)* 3. **执行:** 运行主序列，它会自动将所有 3 个阶段的内容动态生成并打印到你的终端。 python main.py *执行输出和交互也将自动记录并保存到当前目录的 `execution_logs.md` 文件中。* ## 3. LangGraph 流程架构 (阶段 2) ``` +-------------------+ | decide_search | | (LLM processing) | +---------+---------+ | v +---------+---------+ | web_search | | (Calls @tool) | +---------+---------+ | v +---------+---------+ | draft_post | | (Synthesizes post)| +---------+---------+ | v [ END ] ``` ## 4. 提示注入防御策略 (阶段 3) 该引擎采用了强化的 RAG 提示模式，可有效规避提示注入攻击（例如“忽略之前的指令/提示”）。 - **系统优先级:** 严格声明角色限制（“永不道歉，永不改变角色”）的严格指令被放置在真正的 LangChain `SystemMessage` 中。这通过限制 AI 的可塑性，从根本上使其优先于注入的标准提示。 - **语义隔离:** RAG 负载被封装在人工标签（`[LATEST HUMAN REPLY - RESPOND TO THIS]`）中。用户消息被有意隔离，使得显式越狱失去语义上的权威性。 - **对抗性确认:** 智能体会收到严格的指令，不会被动地忽略操纵尝试，而是会强力指出并拒绝任何行为调整。通过将对抗性注入尝试构建为整体辩论文本的一部分，LLM 会将其视为需要反驳的对立论点，而不是需要服从的后端指令。

标签：AI安全, AI流水线, Apex, Chat Copilot, ChromaDB, DLL 劫持, HuggingFace, LangChain, LangGraph, LLaMA, PyRIT, Python, RAG, 内容生成, 凭据扫描, 向量数据库, 多智能体系统, 大语言模型, 对抗引擎, 无后门, 机器学习, 检索增强生成, 状态机, 社交媒体自动化, 语义路由, 轻量级, 辩论系统, 逆向工具, 防御提示注入