daksh-487/grid07-ai

GitHub: daksh-487/grid07-ai

一个集语义路由、自主内容生成和 RAG 辩论对抗于一体的多智能体流水线,重点解决社交场景下智能体角色一致性和提示注入防御问题。

Stars: 0 | Forks: 0

# Grid07 AI - 多智能体角色流水线 ## 1. 项目概述 Grid07 AI 是一个健壮的多智能体社交媒体流水线,利用了 LangChain、LangGraph、Groq 功能以及 ChromaDB。它通过三个独立的阶段处理模拟交互: - **阶段 1 (路由器):** 使用 HuggingFace 句子嵌入和 ChromaDB,基于相似度评分将传入的社交帖子在语义上路由到最相关的 AI 机器人角色。 - **阶段 2 (内容引擎):** 采用 LangGraph 和自定义搜索工具来执行状态机。它会独立研究与智能体角色相关的时事,并输出排版整洁的帖子。 - **阶段 3 (对抗/辩论引擎):** 触发结构化为辩论的严密防御链。它使用 RAG 获取历史上下文,同时极力防止提示注入并维持角色边界。 ## 2. 安装与运行 *(前置条件: Python 3.10+)* 1. **安装依赖:** pip install -r requirements.txt 2. **配置环境:** 将 `.env.example` 复制到 `.env`(或创建一个新的 `.env` 文件)并指定你的 API Key: GROQ_API_KEY=your_groq_api_key_here *(Windows 用户注意事项: PyTorch 依赖的安装路径可能会超过标准路径长度限制。如果 `pip install` 抛出 [Errno 2] 错误,请确保在 Windows 注册表 `HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem -> LongPathsEnabled=1` 中启用长路径。)* 3. **执行:** 运行主序列,它会自动将所有 3 个阶段的内容动态生成并打印到你的终端。 python main.py *执行输出和交互也将自动记录并保存到当前目录的 `execution_logs.md` 文件中。* ## 3. LangGraph 流程架构 (阶段 2) ``` +-------------------+ | decide_search | | (LLM processing) | +---------+---------+ | v +---------+---------+ | web_search | | (Calls @tool) | +---------+---------+ | v +---------+---------+ | draft_post | | (Synthesizes post)| +---------+---------+ | v [ END ] ``` ## 4. 提示注入防御策略 (阶段 3) 该引擎采用了强化的 RAG 提示模式,可有效规避提示注入攻击(例如“忽略之前的指令/提示”)。 - **系统优先级:** 严格声明角色限制(“永不道歉,永不改变角色”)的严格指令被放置在真正的 LangChain `SystemMessage` 中。这通过限制 AI 的可塑性,从根本上使其优先于注入的标准提示。 - **语义隔离:** RAG 负载被封装在人工标签(`[LATEST HUMAN REPLY - RESPOND TO THIS]`)中。用户消息被有意隔离,使得显式越狱失去语义上的权威性。 - **对抗性确认:** 智能体会收到严格的指令,不会被动地忽略操纵尝试,而是会强力指出并拒绝任何行为调整。通过将对抗性注入尝试构建为整体辩论文本的一部分,LLM 会将其视为需要反驳的对立论点,而不是需要服从的后端指令。
标签:AI安全, AI流水线, Apex, Chat Copilot, ChromaDB, DLL 劫持, HuggingFace, LangChain, LangGraph, LLaMA, PyRIT, Python, RAG, 内容生成, 凭据扫描, 向量数据库, 多智能体系统, 大语言模型, 对抗引擎, 无后门, 机器学习, 检索增强生成, 状态机, 社交媒体自动化, 语义路由, 轻量级, 辩论系统, 逆向工具, 防御提示注入