0xgetz/ai-scam-shield
GitHub: 0xgetz/ai-scam-shield
AI Scam Shield 是一款多平台反诈骗检测与隐私防护工具,用于识别虚假 AI 试用网站和伪造 KYC 页面,保护用户个人数据免遭钓鱼和数据收割。
Stars: 0 | Forks: 0
🛡️ AI Scam Shield
保护您的电子邮件和个人数据免受 "免费 AI 试用 / 免费 AI 额度" 诈骗网站以及被广泛用于收割和倒卖数据的 伪造 KYC 页面的侵害。
## ✨ v0.4.0 新特性 - 🛠️ **CI/CD 与工具链**:GitHub Actions(lint + Py 3.9–3.12 测试矩阵 + Codecov)、Release Drafter、Dependabot、Pre-commit(ruff/black)、mkdocs 骨架、Keep-a-Changelog `CHANGELOG.md` - 🔬 **9 个全新检测模块**:DNS/MX、favicon hash、ASN reputation、混淆 JS、伪造 social-proof、Web3 drainer、NIK validator、感知 hash、cookie/tracker 扫描器 - 🔐 **隐私工具**:密码生成器 + 强度指示器、自动脱敏工具(文本 + 图像) - 🚀 **平台**:支持使用 CSV/sitemap 进行批量扫描、服务器安全强化(URL 验证 + API key + rate limit)、新增 endpoint `/api/bulk`、`/api/stix`、`/api/whois-cluster` - 🛡️ **社区**:支持导出 STIX 2.1、WHOIS clustering、feed 脚手架(PhishTank/ThreatFox/Spamhaus/Cloudflare Radar) - 🧩 **扩展程序 v0.4.0**:安全输入防护(HIGH RISK 风险网站显示 banner)、右键菜单扫描、键盘快捷键 Ctrl+Shift+S、通知下拉菜单 查看 [CHANGELOG.md](CHANGELOG.md) 获取完整详情。 ## 🎯 背景 今年以来,**数据泄露**案件激增,原因包括: - 🪤 **伪造的 "免费 AI 试用" / "免费 AI 额度" 网站** — 收割电子邮件/手机号并倒卖。 - 🪪 **伪造 KYC 诈骗** — 以验证或招聘为借口,要求提供身份证照片、自拍照和银行账户信息。 - 📨 **Phishing 与数据收集表单** — 伪装成官方网站的页面,用于窃取凭证和身份信息。 **AI Scam Shield** 能够在您输入个人数据之前检测出这些 **危险信号 (red flags)**。 ## ✨ 完整功能 ### 🔍 检测引擎 (风险评分 0–100) | 模块 | 功能 | |-------|--------| | **URL 启发式检测** | 可疑 TLD、诱饵词汇、IP、HTTPS、子域名、紧迫感(离线) | | **Typosquatting 与同形异义字** | 检测 `g00gle`、`paypa1`、IDN/punycode 域名、品牌名加后缀 | | **白名单** | 受信任的域名 → 减少误报 | | **社区黑名单** | 恶意域名数据库 + 同步**公开 feed**(URLhaus、OpenPhish) | | **WHOIS 域名年龄** | 新注册域名 = 高风险 | | **SSL/TLS 证书** | 过期/新注册/无效证书 | | **重定向链** | Cloaking、URL shortener、跨域跳转 | | **内容扫描** | 敏感表单字段(密码、上传身份证/自拍照) | | **KYC / 招聘诈骗检测器** | 虚假招聘模式:要求押金、不合理薪资、招聘人员私聊 | | **信誉 API** | Google Safe Browsing + VirusTotal(需要 API key) | | **ML 分类器** | 基于 URL 特征的 LogisticRegression → 计算 phishing 概率 | ### 🛡️ 防护与工具 | 功能 | 作用 | |-------|--------| | **邮箱泄露查询** | 通过 HaveIBeenPwned 检查邮箱是否卷入泄露事件 | | **密码查询** | Pwned Passwords k-anonymity(密码绝不会被发送) | | **邮箱别名顾问** | 推荐 `+` 别名及别名/burner 服务 | | **证件水印工具** | 在合法 KYC 之前,为身份证/自拍照添加水印并移除 EXIF 信息 | | **报告生成器** | HTML/PDF 报告 | | **i18n** | 支持印尼语和英语输出 | ### 🚀 平台 | 界面 | 位置 | |-----------|--------| | **CLI** | `scanner.py` | | **浏览器扩展** (MV3) | [`extension/`](extension/) — 实时评分徽章、警告 banner、右键菜单、举报按钮 | | **Web Dashboard + REST API** (Flask) | [`server/`](server/) | | **Telegram Bot** | [`bots/telegram_bot.py`](bots/telegram_bot.py) | ## 🚀 安装 ``` git clone https://github.com/0xgetz/ai-scam-shield.git cd ai-scam-shield pip install -r requirements.txt # fitur lengkap # 或安装为包(命令 `scamshield`): pip install -e . ``` ## 🖥️ 使用方法 (CLI) ``` python scanner.py https://situs.xyz # full scan python scanner.py situs.xyz --offline # tanpa internet python scanner.py situs.xyz --json --report out.html # JSON + laporan python scanner.py situs.xyz --alias kamu@gmail.com # saran alias email python scanner.py situs.xyz --lang en # output Inggris python scanner.py --email kamu@email.com # cek breach email python scanner.py --check-password # cek password (aman) python scanner.py --update-feeds # sinkron feed phishing publik # KTP/selfie watermark 工具: python -m ai_scam_shield.watermark ktp.jpg "KYC BankX 19-06-2026" ktp_wm.jpg ``` 可选的 API key(在扫描前 export): ``` export HIBP_API_KEY=... # https://haveibeenpwned.com/API/Key export GOOGLE_SAFE_BROWSING_API_KEY=... export VIRUSTOTAL_API_KEY=... ``` ## 🧩 浏览器扩展 提供实时评分徽章、HIGH RISK 风险网站警告 banner、右键菜单“扫描链接”以及“举报网站”按钮。指南:**[extension/README.md](extension/README.md)**。 `chrome://extensions` → *开发者模式* → **加载已解压的扩展程序** → 选择 `extension/` 文件夹。 ## 🌐 Web Dashboard + REST API ``` pip install flask python server/app.py # http://localhost:5000 # API: GET /api/scan?url=https://situs.xyz ``` 或通过 Docker: ``` docker build -t ai-scam-shield . docker run -p 5000:5000 ai-scam-shield ``` ## 🤖 Telegram Bot ``` export TELEGRAM_BOT_TOKEN=... # dari @BotFather python bots/telegram_bot.py ``` ## 🗂️ 项目结构 ``` ai-scam-shield/ ├── scanner.py # CLI utama (orkestrator semua modul) ├── ai_scam_shield/ # paket inti │ ├── url_heuristics.py whois_check.py content_scan.py │ ├── breach_check.py blacklist.py typosquat.py │ ├── whitelist.py feeds.py alias_advisor.py │ ├── reputation.py ssl_check.py redirects.py │ ├── kyc_detector.py ml_classifier.py report.py │ ├── watermark.py i18n.py cache.py ├── data/ # blacklist, whitelist, brand, training ML ├── extension/ # ekstensi browser (Manifest V3) ├── server/ # Flask web dashboard + REST API ├── bots/ # bot Telegram ├── tests/ # pytest ├── pyproject.toml Dockerfile .github/workflows/ci.yml └── requirements.txt CONTRIBUTING.md ``` ## 🧪 测试 ``` python -m pytest tests/ -q ``` ## 🗺️ 路线图 — 计划功能 ### 🔬 检测与情报 - [x] **DNS/MX 分析** — `ai_scam_shield.dns_mx` — 缺失 MX、NS 过少、一次性域名 - [x] **Favicon hashing** — `ai_scam_shield.favicon_hash` — SHA-256 hash + ICO parser - [x] **视觉钓鱼检测 (pHash)** — `ai_scam_shield.visual_phish` — aHash fallback + 结构指纹 - [x] **Web3 drainer 检测器** — `ai_scam_shield.web3_drainer` — 匹配 11 种模式的正则表达式 (setApprovalForAll, eth_sign 等) - [x] **混淆 JS 检测器** — `ai_scam_shield.obfuscated_js` — packer/hex-escape/atob/entropy - [x] **ASN/hosting 信誉** — `ai_scam_shield.asn_reputation` — Team Cymru DNS、bulletproof hosting 列表 - [x] **伪造 social-proof 检测器** — `ai_scam_shield.fake_social_proof` — 倒计时 + “X 人正在查看” - [x] **NIK/KTP 格式验证器** — `ai_scam_shield.nik_validator` + 分享前警告 - [ ] **Certificate Transparency 监控器** `[deferred]` — 需要 crt.sh + scheduler - [ ] **银行账户/手机号查询** `[deferred]` — 需要接入 kredibel.id/cekrekening.id API ### 🔐 隐私与工具链 - [ ] **持续泄露监控 + 告警** `[deferred]` — 需要 scheduler + push channel - [x] **密码生成器 + 强度指示器** — `ai_scam_shield.password` - [ ] **2FA/TOTP 实时审计** `[deferred]` — 需要访问用户 vault - [x] **OAuth scope 审计器 (启发式)** — `ai_scam_shield.oauth_auditor` - [ ] **隐私政策摘要器 (LLM)** `[deferred]` — 需要 LLM API key - [x] **Cookie/tracker 扫描器** — `ai_scam_shield.cookie_scanner` - [x] **文档自动脱敏** — `ai_scam_shield.redactor` — 文本 (regex) + 图像 (Pillow 模糊处理) ### 🚀 平台与用户体验 (UX) - [ ] **PWA / 移动应用** `[deferred]` — 需要单独的素材和 service worker - [ ] **WhatsApp、Discord / Slack App Bot** `[deferred]` — 需要外部 bot 账号 - [ ] **邮件网关** `[deferred]` — 需要邮件服务器 - [x] **支持 CSV/sitemap 批量扫描** — `ai_scam_shield.bulk_scan` + CLI flags - [x] **扩展中的安全输入防护** — `extension/content.js` — 在 HIGH RISK 风险网站显示警告 banner - [x] **Telegram 频道输出** — 已有 `bots/telegram_bot.py,随时可集成 - [x] **公开 API 服务 + API key + rate limit** — 带有滑动窗口的 `server/app.py` ### 🧠 ML/AI - [ ] **升级模型 (gradient boosting / NN)** `[deferred]` — 需要数据集与 retraining pipeline - [ ] **LLM 页面分类器** `[deferred]` — `ai_scam_shield.llm_classifier` (脚手架) — 需要 API key - [ ] **Logo 检测 (CV)** `[deferred]` — 需要训练好的 CV 模型 - [ ] **可解释 AI (SHAP)** `[deferred]` — 需要待解释的 ML 模型 - [ ] **端侧模型 (TensorFlow.js)** `[deferred]` — 需要新的 extension 架构 ### 🛡️ 社区与数据 - [ ] **众包举报门户网站** `[deferred]` — 需要 backend + DB + 审核 - [x] **更多 feed** — `ai_scam_shield.feeds_extra` (PhishTank/ThreatFox/Spamhaus/Cloudflare Radar 脚手架) - [ ] **自动提交** 至 Safe Browsing / PhishTank `[deferred]` — 需要 API key + 审批 - [x] **WHOIS clustering** — `ai_scam_shield.whois_cluster` (按注册人 + 隐私掩码处理) - [x] **导出威胁情报 (STIX 2.1)** — `ai_scam_shield.stix_export` ### ⚙️ 工程 / 运维 - [x] **Pre-commit + ruff/black/mypy** — `.pre-commit-config.yaml`,ruff 配置位于 `pyproject.toml` - [x] **覆盖率 + Codecov 徽章** — CI 中的 `pytest-cov`,README 中的徽章 - [x] **发布自动化 + 更新日志** — `.github/workflows/release-drafter.yml`, `CHANGELOG.md` (Keep a Changelog 格式) - [ ] **发布** 至 PyPI / Docker Hub / Chrome Web Store `[deferred]` — 需要账号和密钥 - [x] **文档站点 (mkdocs)** — `mkdocs.yml` 骨架 + `docs/` 页面 **v0.4.0 总结**:已完成 17 项路线图任务,13 项被推迟(需要凭证/API key/基础设施)。详情请见 [CHANGELOG.md](CHANGELOG.md)。 ## ⚠️ 免责声明 本工具仅用于**教育与自我防护**。结果基于启发式算法,可能会出现误判。请负责任地使用;请勿用于攻击或滥用他人网站。 ## 📄 许可证 [MIT](LICENSE)标签:Python, 个人信息保护, 反欺诈, 威胁情报, 安全规则引擎, 开发者工具, 数据可视化, 无后门, 无服务器架构, 请求拦截, 逆向工具, 钓鱼检测