Carlos-Projects/palisade-scanner

GitHub: Carlos-Projects/palisade-scanner

Palisade Scanner 是一款用于检测网页内容中针对 AI 代理的潜在安全威胁的工具。

Stars: 0 | Forks: 1

# 堡垒扫描仪 🔍 [![PyPI](https://img.shields.io/pypi/v/palisade-scanner)](https://pypi.org/project/palisade-scanner/) [![Python 3.11+](https://img.shields.io/badge/python-3.11%2B-blue)](https://python.org) [![License: MIT](https://img.shields.io/badge/license-MIT-green)](LICENSE) [![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/a19c42c325014449.svg)](https://github.com/Carlos-Projects/palisade-scanner/actions) [![HuggingFace Space](https://img.shields.io/badge/🤗%20Try%20it%20now-HF%20Spaces-yellow)](https://huggingface.co/spaces/Syntho/palisade-scanner) [![Star History](https://img.shields.io/badge/Star-History-blue?style=social)](https://api.star-history.com/svg?repos=Carlos-Projects/palisade-scanner&type=Date) **[在 HuggingFace Spaces 上实时试用](https://huggingface.co/spaces/Syntho/palisade-scanner)** — 粘贴一个 URL。检测它是否包含针对 AI 代理的隐藏指令。 **扫描网页内容以检测针对 AI 代理的提示注入、隐藏指令和对抗性内容。** AI 代理浏览网页、阅读文档和消费外部内容。对手可以在以下地方隐藏指令: - **不可见文本**(白色背景上的白色文本、零字号字体、屏幕外定位) - **HTML 注释和元数据** - **Base64 编码的有效载荷** - **零宽度字符注入** - **伪装成产品描述或评论的指令** 此扫描器可以找到所有这些,并告诉您如何处理它们。 ### 风险示例 | 场景 | 风险等级 | Palisade 找到的内容 | |------|----------|---------------------| | 清洁营销页面 | ✅ **低** | 没有隐藏文本,没有注入模式,没有数据泄露 | | 隐藏 CSS 提示注入 | 🔴 **高** | `display:none` 文本与角色覆盖指令 | | 元数据泄露提示 | 🚨 **关键** | HTML 注释 + JSON-LD + base64 编码的数据窃取有效载荷 | ## Palisade 的独特之处 | 功能 | Palisade Scanner | 人工审查 | 通用抓取器 | |-----|----------------|----------|----------| | **隐藏文本检测** | ✅ 20+ CSS/HTML 技术 | ❌ | ❌ | | **注入模式匹配** | ✅ 100+ 正则表达式,5 个类别 | ❌ | ❌ | | **LLM-as-judge 分类器** | ✅ 理解对抗性意图 | N/A | ❌ | | **元数据分析** | ✅ 注释、JSON-LD、元标签、数据属性、`