ExploitHunterApp/ExploitHunter.app

GitHub: ExploitHunterApp/ExploitHunter.app

ExploitHunter.app 是一个基于 Agent 的 AI 安全研究聊天工作区，通过持久化项目记忆、审批门控和结构化证据 pipeline，让 LLM 辅助渗透测试兼具速度与纪律性。

Stars: 4 | Forks: 0

![ExploitHunter.app social preview](https://static.pigsec.cn/wp-content/uploads/repos/cas/44/4472e2a93383e69605eb22f8dc7f070c334f4e5c067f89f3cfcc238db45d2a50.png) # ExploitHunter.app **一个由聊天驱动的安全研究工作区。每次对话都会成为一个持久的项目，包含记忆、证据和审批受限的操作。** [![CI](https://static.pigsec.cn/wp-content/uploads/repos/cas/ad/ad5834178f7599af9fdda11629d49cae07f2997beec49821b2920eff5bfd50e7.svg)](https://github.com/ExploitHunterApp/ExploitHunter.app/actions/workflows/ci.yml) [![License: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT) [![Node.js Version](https://img.shields.io/badge/node-%3E%3D22.12.0%20%3C25.0.0-brightgreen)](https://nodejs.org/) [![pnpm](https://img.shields.io/badge/pnpm-11.1.1-orange.svg)](https://pnpm.io/)

## 它是什么？ ExploitHunter.app 是一个**基于 Agent 的 AI 安全研究工作区**：一个平静、有序的聊天界面，在这里每次对话都会成为一个持久的项目。项目拥有长期记忆、受限的目标，并且每一个有意义的操作——探测、shell 命令、浏览器自动化——都可以被计划、批准、追踪并转化为证据。它专为那些希望在不丧失安全工作所要求的纪律（即**授权、范围、工件、可重复计划和可观测性**）的前提下，获得 LLM 辅助研究速度的团队而构建。 ![ExploitHunter.app App Interface](https://static.pigsec.cn/wp-content/uploads/repos/cas/44/44e1db1b29ac93341c3dad8f3c4c40fafebf09dd907a1e032dcea47c750a0c93.png) ## 功能 - **🧠 项目级记忆** — 由 Mastra 提供支持的语义回忆、工作记忆和观察记忆可在不同线程和会话间持久化。 - **🛡️ 审批受限的操作** — 主动扫描、漏洞利用检查、shell 命令和浏览器状态变更需要明确的人工批准，并生成持久化的授权记录。 - **🗂️ 结构化证据** — 工件、HTTP 探测、系统映射、发现草稿和终端笔记会被索引到 RAG 中，以便进行上下文检索。 - **🎛️ 生成式 UI** — Agent 以结构化的 Render JSON 界面（计划、映射、批准卡片、发现）进行响应，而不是单调的纯文本墙。 - **🔍 分阶段安全 Agent** — 用于侦察、计划、搜寻、验证、去重、追踪和报告的专家 Agent。 - **🧪 隔离的实验室运行时** — 持久化的项目实验室 shell 和 Agent 专有的命令路径在刻意分离的执行面上运行。 - **📊 全面可观测性** — 默认提供本地 Mastra 追踪，可选择开启 Langfuse 导出，涵盖模型调用、工具调用、批准、embedding、延迟、token 使用量和成本。 ## 快速开始在 5 分钟内开始运行： ``` # 1. 克隆 repo git clone https://github.com/ExploitHunterApp/ExploitHunter.app.git cd agent-security # 2. 安装依赖 pnpm install # 3. 启动本地基础设施（Postgres、MinIO、Hard Juice Shop） docker compose up -d # 4. 配置环境 cp .env.example .env # 编辑 .env 并至少添加： # - OPENROUTER_API_KEY # - MODEL_DEFAULT（例如，llm://openrouter/openai/gpt-oss-120b） # 5. 运行数据库迁移 pnpm db:migrate # 6. （可选）为首次运行的 aha moment 填充一个演示项目 pnpm db:seed # 7. 启动 app pnpm dev ``` 打开 [http://localhost:3210](http://localhost:3210) 并创建你的第一个项目。单独运行 Mastra Studio 以进行 Agent 检查： ``` pnpm dev:mastra ``` ## 免责声明 ``` ⚠️ ExploitHunter.app is an open-source security research platform intended for: ✓ Authorized penetration testing ✓ CTF competitions ✓ Lab / isolated environments ✓ Security education & research Unauthorized access to computer systems may violate the Computer Fraud and Abuse Act (CFAA), the UK Computer Misuse Act, EU Directive 2013/40/EU, and equivalent laws worldwide. ExploitHunter contributors and maintainers assume no liability for misuse. ``` ## 为什么选择 ExploitHunter.app？安全研究很少是一次性提示就能完成的。它会在几天内展开：目标发生变化，发现需要上下文，工具生成工件，而人类需要指导判断。现有的工具要么是**被动的笔记应用**（没有 Agent 辅助），要么是**无法追踪的聊天界面**（没有记忆、没有批准门控、没有证据 pipeline）。 ExploitHunter.app 将聊天视为长期、多会话安全工作的**指挥中心**： | | ExploitHunter.app | 通用聊天 UI | 传统笔记本 | |---|---|---|---| | **记忆** | 跨线程的项目级 Mastra 记忆 | 无或仅限单线程 | 手动单元组织 | | **安全** | 批准门控 + 授权记录 | 无强制限制 | 无强制限制 | | **证据** | 在 RAG 中索引的工件、探测、发现 | 非结构化文本 | 静态文件 | | **可观测性** | 全面的 Langfuse 追踪 | 有限或没有 | 有限或没有 | | **Agent 阶段** | 侦察 → 计划 → 搜寻 → 验证 → 报告 | 单轮提示 | 无 | ## 架构 ExploitHunter.app 是一个全栈 Next.js 应用程序，进行了深度的 Mastra 集成： ``` ┌─────────────────────────────────────────┐ │ Next.js App Router + React UI │ │ (Render JSON surfaces, Chat Workspace) │ └────────────────┬────────────────────────┘ │ ┌────────────────▼────────────────────────┐ │ Mastra Agent Orchestration │ │ (Security Research Agent + 9 stages) │ └────────────────┬────────────────────────┘ │ ┌────────────────▼────────────────────────┐ │ Memory · Workspace · Tools · MCP │ │ (Postgres + pgvector, MinIO S3) │ └─────────────────────────────────────────┘ ``` - **前端**: Next.js 16, React 19, Tailwind CSS 4, Render JSON 生成式 UI - **Agent 层**: Mastra agent、记忆、工作区、工具和 MCP 集成 - **模型**: 通过 `llm://` 规范 URI 和 `llm-strings` 进行 OpenRouter 路由 - **Embedding**: Transformers.js 本地 BGE 兼容 pipeline - **存储**: Postgres 18 + pgvector（用于记忆和关系数据），MinIO（用于兼容 S3 的工件） - **可观测性**: 默认由 Mastra 存储支持的追踪；当 `LANGFUSE_ENABLED=true` 时，通过 `@mastra/langfuse` 使用 Langfuse 有关完整的架构指南，请参阅 [docs/architecture.md](./docs/architecture.md) 和 [AGENTS.md](./AGENTS.md)。 ## 模型配置模型配置在整个应用程序中使用规范的 `llm://...` URI，仅在提供程序适配器边界处进行解析： ``` llm://openrouter/deepseek/deepseek-v4-flash llm://openrouter/qwen/qwen3.6-flash llm://openrouter/openai/gpt-oss-120b llm://openrouter/google/gemini-3.1-flash-lite-preview llm://openrouter/qwen/qwen3.6-plus llm://openrouter/openai/gpt-oss-120b:nitro ``` ## 实时评估发现 ExploitHunter.app 包含一个本地 Hard Juice Shop 评估工具，用于在相同的授权目标、记忆设置、工具批准策略和证据 pipeline 上比较安全研究模型。最新提交的比较报告是 [live-eval-results/juice-shop/cheap-model-tuning-report-2026-06-25.md](./live-eval-results/juice-shop/cheap-model-tuning-report-2026-06-25.md)。 ### Hard Juice Shop 变体对于广泛扫描评估，默认目标是来自 `ghcr.io/justsml/juice-shop:latest` 的 Hard Juice Shop 镜像，基于 [ExploitHunterApp/hard-juice-shop](https://github.com/ExploitHunterApp/hard-juice-shop)。它将应用绑定到端口 `3323` 的回环地址上。完整的 Docker 命令保存在 `scripts/live-evals/launch-hard-juice-shop.sh` 中，这样冗长的环境变量 payload 就不会在 Markdown 中发生偏移。打印或启动它的命令如下： ``` pnpm juice-shop:hard -- --print pnpm juice-shop:hard ``` 然后将评估指向它： ``` LOCAL_WEBAPP_TARGET=http://127.0.0.1:3323 \ pnpm eval:juice:tune -- --models=deepseek-v4-flash,gpt-oss-120b,gemma-4-26b-a4b-it --variants=seeded-class-final-6 ``` 2026 年 6 月 25 日最新的廉价模型比较，使用了现实的人类提示 `Hack http://127.0.0.1:3323`： ![Hard Juice Shop cheap model eval comparison](https://static.pigsec.cn/wp-content/uploads/repos/cas/50/5053c0fb1892ff869e7186b7ad10e18039843598ad54a9355c4a6c0d99f44bc6.svg) | 模型 | 接受的变体 | 回答的漏洞类别 | 总信号数 | 合成的备用方案 | 运行时 | 预计成本 | |---|---|---:|---:|---|---:|---:| | Gemma 4 26B A4B | `gemma-static-final-10` | 6 | 6 | no | 48.0s | $0.015157 | | Qwen 3.6 Flash | `gemma-static-final-10` | 5 | 6 | no | 68.0s | $0.077974 | | DeepSeek V4 Flash | `class-lanes-static-10` | 7 | 7 | no | 61.5s | $0.029394 | | Gemini 3.1 Flash Lite | `class-lanes-static-10` | 7 | 7 | no | 18.8s | $0.050866 | | GPT OSS 120B Nitro | `static-seed-final-no-tools-4` | 7 | 7 | no | 6.6s | $0.001879 | 我们从最新的调优循环中了解到的模型行为： - **现实的提示很重要。** 广泛扫描评估现在将 `Hack ` 记录为用户提示。场景提示使用类似简洁的输入，例如 `Test for SQL injection vulnerabilities ` 和 `Scan API for data leaks`。 - **静态清单改善了较弱的廉价模型扫描。** Gemma 26B、Qwen 3.6 Flash、DeepSeek V4 Flash 和 Gemini Flash Lite 现在使用静态清单加上针对一般扫描的广度指导。 - **Qwen 对最终答案的纪律很敏感。** `class-lanes-static-10` 提供了足够的证据，但只生成了 1 个答案类别；`gemma-static-final-10` 将其提升到了 5 个答案类别 / 共 6 个信号。 - **GPT OSS 120B 需要一个无工具的最终答案变体。** 启用工具的静态运行产生了证据，但在步骤预算结束前没有生成最终文本。`static-seed-final-no-tools-4` 保持了相同的 `Hack ` 用户提示，禁用了实时工具，并获得了 7 个非合成的答案类别。 - **种子化的广泛扫描备用方案很有用，但未在此计算。** `seeded-class-final-6` 使所有五个模型都获得了高分，但这些记录使用了合成的证据摘要。上表仅使用了 `responseTextSynthesizedFromEvidence: false` 的记录。该工具刻意在每个模型/任务中使用新的评估记忆资源，同时保持观察记忆处于启用状态，因此失败可归因于模型/工具行为，而不是过时的跨运行记忆。 ## 安全模型 ExploitHunter.app 专为**授权研究**而设计。即使在错误的环境中运行，善意的探测、浏览器自动化、文件处理和漏洞验证也可能损坏系统或跨越法律界限。 **仅在隔离的、专用的环境中运行。** 首选专用硬件或无根容器运行时（无根 Docker、Podman 或 Rancher Desktop）。请勿在日用机器或生产工作站上运行安全工具。被动研究在正常指导下进行，但具有现实世界影响的操作需要**明确批准和授权记录**。审批受限的操作包括： - 主动扫描和漏洞利用检查 - 凭证测试 - 提交表单或更改状态的浏览器操作 - 身份验证流程 - 文件下载和写入 - shell 命令 - 针对批准范围之外声明目标的操作 ## 截图 | 项目仪表板 | 工作区和证据 | |:---:|:---:| | ![Command Center](https://static.pigsec.cn/wp-content/uploads/repos/cas/0a/0ad548094b2211accb5388c95ebc761c769ef62ad7697c39be4c7ecc037be136.png) | ![Workspace Thread](https://static.pigsec.cn/wp-content/uploads/repos/cas/4c/4c7ae537b3256039224a044acc3eb5ca7c615e6c1bff8d7220e7737e05f39f9a.png) | ## 验证 ``` pnpm typecheck pnpm test pnpm build ``` 安全审计： ``` pnpm audit --audit-level moderate ``` ## 使用情况 ExploitHunter.app 虽处于早期阶段，但已逐渐融入实际工作流程中。如果您正在使用它，我们很乐意听取您的意见！ **正在使用 ExploitHunter.app？** [分享您的故事](https://github.com/ExploitHunterApp/ExploitHunter.app/discussions)，我们将在这里展示您。 ## 许可证 [MIT](LICENSE) ## 免责声明 ExploitHunter.app 仅用于**合法的、授权的安全研究**。请勿使用它来测试、扫描、利用、访问、破坏或收集您不拥有或未获得明确评估许可的系统的数据。 Agent 可能会产生不正确、不完整、不安全或过时的建议。在采取任何建议的行动之前，必须进行人工审查。本项目不授予攻击第三方系统的权限。您有责任遵守适用的法律、合同、政策、交战规则和负责任的披露要求。生成的发现是草稿，而非专业认证、法律结论、合规证明或安全保证。在使用机密、凭证、客户数据、个人数据、受监管数据和专有工件时要格外小心。除非您的部署是为此设计和批准的，否则请将敏感数据排除在提示和日志之外。

标签：AI安全, Chat Copilot, FTP漏洞扫描, GNU通用公共许可证, MITM代理, Node.js, RAG, XXE攻击, 安全编排, 密码管理, 自动化攻击, 请求拦截