AISecurityLab/hackagent

GitHub: AISecurityLab/hackagent

HackAgent 是一款开源的 AI Agent 安全测试工具包，旨在通过自动化攻击模拟帮助用户发现智能体中的 Prompt 注入及越狱等安全漏洞。

Stars: 94 | Forks: 18

AI 安全红队工具包
[应用](https://app.hackagent.dev/) -- [文档](https://docs.hackagent.dev/) -- [API](https://api.hackagent.dev/schema/redoc)
![Python Version](https://img.shields.io/badge/python-3.10%2B-blue) ![License](https://img.shields.io/badge/license-Apache%202.0-green) ![uv](https://img.shields.io/endpoint?url=https://raw.githubusercontent.com/astral-sh/uv/main/assets/badge/v0.json) [![Commitizen](https://img.shields.io/badge/commitizen-friendly-brightgreen.svg)](http://commitizen.github.io/cz-cli/) ![Ruff](https://img.shields.io/endpoint?url=https://raw.githubusercontent.com/astral-sh/ruff/main/assets/badge/v2.json) ![Test Coverage](https://img.shields.io/codecov/c/github/AISecurityLab/hackagent) ![CI Status](https://img.shields.io/github/actions/workflow/status/AISecurityLab/hackagent/ci.yml)

## 概述 HackAgent 是一个开源工具包，旨在帮助安全研究人员、开发者和 AI 安全从业者评估 AI agent 的安全性。它提供了一种结构化的方法来发现潜在的漏洞，包括 prompt 注入、越狱技术以及其他攻击向量。 ## 🔥 功能特性 - **全面的攻击库**：用于 prompt 注入、越狱和目标劫持的预构建技术 - **模块化框架**：易于扩展自定义攻击向量和测试方法 - **注重安全**：包含负责任的披露准则和道德使用建议 ### 🔌 支持的 AI Agent 框架 [![LiteLLM](https://img.shields.io/badge/LiteLLM-blue?style=flat&logo=github)](https://github.com/BerriAI/litellm) [![ADK](https://img.shields.io/badge/Google-ADK-green?style=flat&logo=openai)](https://google.github.io/adk-docs/) [![OpenAI](https://img.shields.io/badge/OpenAI-SDK-412991?style=flat&logo=openai)](https://platform.openai.com/docs) ## 🚀 安装说明 ### 从 PyPI 安装 HackAgent 可以直接从 PyPI 安装： ``` # 使用 uv（推荐） uv add hackagent # 或使用 pip pip install hackagent ``` ## 📚 快速入门运行交互式 CLI 以开始测试您的 AI agent： ``` hackagent ``` 或者使用 SDK： ``` from hackagent import HackAgent, AgentTypeEnum agent = HackAgent( name="my_agent", endpoint="http://localhost:8000", agent_type=AgentTypeEnum.GOOGLE_ADK ) results = agent.hack(attack_config={ "attack_type": "advprefix", "goals": ["Test goal"], # ... generator and judges config }) ``` 在 [https://app.hackagent.dev](https://app.hackagent.dev) 获取您的凭据有关详细的示例和高级用法，请访问我们的[文档](https://docs.hackagent.dev)。 ## 📊 报告 HackAgent 会自动将测试结果发送到仪表板进行分析和可视化。在 [https://app.hackagent.dev](https://app.hackagent.dev) 访问您的仪表板 ## 🤝 参与贡献我们欢迎各种形式的贡献！请参阅 [CONTRIBUTING.md](CONTRIBUTING.md) 和 [CODE_OF_CONDUCT.md](CODE_OF_CONDUCT.md) 了解相关指南。 ## 📜 许可证本项目采用 Apache License 2.0 授权 - 详情请参阅 [LICENSE](LICENSE) 文件。 ## ⚠️ 免责声明 HackAgent 是一款专为安全研究和提升 AI 安全性而设计的工具。在测试任何 AI 系统之前，请务必获得适当的授权。作者不对本软件的任何滥用行为负责。 *本项目仅供教育和研究目的。请始终负责任且合乎道德地使用。*

标签：AI安全, AI红队, Chat Copilot, DNS解析, Google ADK, LiteLLM, OpenAI, Python, RuleLab, 人工智能安全, 内存规避, 反取证, 合规性, 域名收集, 大模型安全, 安全评估, 开源项目, 攻击向量, 无后门, 目标劫持, 网络安全, 误配置预防, 逆向工具, 隐私保护