anujpundora/repo-intelligence-ai

GitHub: anujpundora/repo-intelligence-ai

基于多智能体架构的代码仓库智能分析系统,结合 RAG、向量搜索和 LLM 推理实现安全漏洞与代码缺陷的自动化检测。

Stars: 0 | Forks: 0

自主多智能体仓库智能系统 一个 Agentic AI 系统,利用多智能体推理、检索增强生成 (RAG)、向量搜索和工具驱动分析来分析软件仓库,以检测 Bug、安全漏洞和代码问题。 该系统使用 Planner Agent 来协调专门检查仓库代码并生成经过验证的分析结果的专用智能体。 ## 概述 本项目实现了一个自主 AI 代码分析流水线,能够: - 使用语义搜索理解仓库代码 - 运行迭代式安全和 Bug 分析智能体 - 执行工具驱动的代码检查 - 通过 Reflection Agent 验证结果 - 生成整合的分析报告 该系统展示了结合 LLM 推理与确定性工具的模块化 Agentic AI 架构。 ## 架构 Repository ↓ Code Ingestion ↓ Chunking + Embedding ↓ Chroma Vector Database ↓ Planner Agent ↓ Security Agent ↓ Bug Agent ↓ Reflection Agent ↓ Final Analysis Report ## 核心功能 ### 多智能体架构 该系统使用 Planner Agent 来协调负责分析仓库代码的专门智能体。 智能体使用共享上下文内存协作,传递观察结果和发现。 ### 检索增强生成 (RAG) 系统在执行分析之前从仓库中检索相关的代码片段。 流水线: Repository → Code Chunking → Embeddings → Vector DB → Semantic Search 这使智能体能够仅分析大型仓库中的相关部分。 ### 向量数据库集成 代码 Embedding 存储在 ChromaDB 中,支持: - 语义代码搜索 - 跨大型仓库的高效检索 - 上下文感知的智能体推理 ### 基于 AST 的代码分析 系统集成抽象语法树 (AST) 解析,以分析程序结构并改进超越纯文本的代码推理。 AST 分析允许: - 语法验证 - 结构化代码理解 - 检测逻辑问题 ### 工具驱动的智能体推理 专家智能体执行确定性工具进行分析,而不是仅依赖 LLM 推理。 示例工具: **安全分析** - SQL 注入检测 - 硬编码密钥检测 - 命令注入检测 **Bug 检测** - 语法验证 - 无限循环检测 - 静态代码分析 智能体使用以下方式迭代: Think → Select Tool → Execute → Observe → Repeat ### 多 LLM 路由 系统集成多个 LLM 提供商,并具有自动回退功能。 当前路由: - Primary LLM → Gemini - Fallback LLM → Groq (LLaMA models) 优势: - 提高可靠性 - 具成本效益的推理 - 减少停机时间 ### Reflection Agent Reflection Agent 验证由专家智能体生成的结果。 职责: - 验证检测到的漏洞 - 移除误报 - 结合 Bug 和安全发现 - 生成整合报告 这显著减少了 LLM 幻觉。 ## 智能体工作流 典型的智能体执行: - Step 1 → query_chunks 从仓库检索相关代码 - Step 2 → security_agent 分析代码中的漏洞 - Step 3 → bug_agent 检测逻辑错误和语法问题 - Step 4 → reflection_agent 验证发现并合并结果 - Step 5 → finish 返回最终报告 ## 示例输出 **安全发现:** 未检测到漏洞。 **Bug 发现:** 在身份验证模块中检测到语法错误。 **Reflection Agent 总结:** 已验证问题: - 导致语法错误的意外缩进 严重程度:Medium ## 技术栈 ### 编程语言 - Python - JavaScript - Java ### AI & LLM 技术 - Agentic AI Systems - Multi-Agent Architecture - Retrieval-Augmented Generation (RAG) - Gemini API - Groq API - LLM Prompt Engineering - AI Agent Orchestration - Planner Agent - Security Agent - Bug Agent - Reflection Agent - Tool-Driven Agents ### 后端 - FastAPI - REST APIs - Asynchronous Processing ### 数据库 - PostgreSQL - MySQL - ChromaDB - FAISS ### 工具 & DevOps - Git - Docker - Postman - AWS (Fundamentals) - Vercel ## 仓库结构 ![Alt Text](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/7edc504d49044027.png) ## 如何运行 安装依赖项 运行系统 系统将: - 接入仓库代码 - 创建 Embedding - 将向量存储在 ChromaDB 中 - 执行多智能体分析 - 生成最终报告 ## 未来改进 计划功能: - 用于自动代码修复的 Fix Agent - 感知 AST 的代码分块 - 高级静态分析工具 - GitHub Pull Request 集成 - 仓库级推理 - 多语言代码支持 ## 项目目标 本项目展示了 Agentic AI 系统如何结合: - LLM 推理 - 确定性工具 - 语义检索 - 多智能体协作 以构建自主软件分析系统。
标签:Agentic AI, Bug检测, ChromaDB, DevSecOps, DLL 劫持, DNS 反向解析, DNS解析, DOE合作, LLM, odt, Planner Agent, PyRIT, Python, RAG, Reflection Agent, Sysdig, Unmanaged PE, 上游代理, 云安全监控, 人工智能, 代码分析, 代码安全, 代码审查, 代码理解, 凭证管理, 向量数据库, 域环境探测, 多智能体系统, 大语言模型, 威胁情报, 开发者工具, 开源项目, 性能分析, 抽象语法树, 数据管道, 文档安全, 无后门, 检索增强生成, 测试用例, 漏洞枚举, 用户模式Hook绕过, 网络安全研究, 自动化报告, 语义搜索, 请求拦截, 软件工程, 逆向工具, 静态分析