Avzolem/sabuezo
GitHub: Avzolem/sabuezo
Sabuezo 是一个为墨西哥中小企业设计的反诈骗WhatsApp机器人和网站安全扫描器,通过AI分析提供实时防护。
Stars: 1 | Forks: 0
# Sabuezo 🐕
🌐 **实时演示**:
📱 **WhatsApp 机器人**:`+52 1 614 216 6179`
🎯 **赛道**:DEF/ACC · hack@latam 2026 · indies.la
## 解决什么问题?
墨西哥拥有 **490万家中小企业**。占企业总数的99.8%。它们创造了每10个就业机会中的7个。
**但没有一家拥有网络安全团队。** 其中60%将在今年遭受网络攻击。
Sabuezo 让每一家文具店、餐厅、修理厂和诊所都获得
与财富500强企业同等水平的防御能力——通过WhatsApp实现,无需雇佣任何人。
它结合了 **拉丁美洲其他任何产品都无法关联的两种防御能力**:
1. **防钓鱼 WhatsApp 机器人** — 转发可疑消息、截图或邮件。在几秒内通过AI完成分析,并针对真实的墨西哥骗局(SAT、BBVA、Banamex、供应商欺诈、虚拟绑架、CEO欺诈、短信钓鱼)进行训练。
2. **网站安全诊断** — 自动扫描:SSL、邮件头、邮箱配置(SPF/DKIM/DMARC)、CMS、暴露的文件。提供简明易懂的中文执行摘要报告。
### 跨领域洞察
如果你的域名 SPF/DMARC 配置错误,**任何人都可以发送冒充你公司的邮件**。这解释了为什么你的团队会收到这么多伪造你组织地址的钓鱼邮件。Sabuezo 将两点联系起来:**攻击的进入方式和敞开的防御后门**。
## 架构
```
┌──────────────────────────────────────────────────────────┐
│ Usuario final (PyME) │
└─────────┬───────────────────────────┬────────────────────┘
│ WhatsApp │ Browser
▼ ▼
┌──────────────────┐ ┌──────────────────┐
│ Bot Baileys │ │ Next.js 16 │
│ FastAPI │ │ sabuezo.vercel │
│ Site Scanner │ │ + /api/scan │
│ (self-hosted) │ │ + Cloudflared │
└────────┬─────────┘ └────────┬─────────┘
│ writes │ reads
▼ ▼
┌─────────────────────────────────────┐
│ Supabase Postgres │
│ pymes · scans · detections │
└─────────────────────────────────────┘
│
▼
┌──────────────┐
│ Anthropic │
│ Haiku+Sonnet │
└──────────────┘
```
### 技术栈
- **WhatsApp 机器人**:Node.js + [Baileys](https://github.com/WhiskeySockets/Baileys) (多设备、无浏览器、自托管)
- **后端**:Python + FastAPI · 异步管道
- **LLMs**:Claude **Haiku 4.5** (文本) + **Sonnet 4.6** (截图视觉分析)
- **数据库**:Supabase Postgres + RLS · 3张表 + 1个视图 (`pyme_overview`)
- **前端**:Next.js 16 (App Router) + Tailwind v4 + lucide-react
- **部署**:Vercel (前端) · 自托管机器人+后端 · 使用 Cloudflared quick-tunnel 暴露 API
- **持久化**:机器人+后端使用 `service_role` 写入;前端使用 `publishable` 密钥读取
### 站点扫描器检测内容
- 🔒 SSL/TLS:有效性、过期时间、颁发者
- 🛡️ 安全头:HSTS, CSP, X-Frame, X-Content-Type-Options, Referrer-Policy
- 📧 邮箱认证:**SPF, DKIM, DMARC** (包含 `p=` 策略)
- 🧩 CMS 指纹识别:WordPress, Wix, Shopify, Drupal, Joomla, Squarespace, Next, Express
- 📂 暴露的文件:`.env`, `.git/HEAD`, `/wp-admin`, `/phpmyadmin`, 备份文件, `.htaccess`
- 📅 域名年龄 (WHOIS)
- 🏷️ 评分 0-100 + 如何修复每个发现的报告
### 机器人检测内容
- 假冒 SAT / CFDI / 税务邮箱
- 假冒墨西哥银行 (BBVA, Banamex, Santander, Banorte, HSBC, Banco Azteca, Inbursa)
- 供应商欺诈 (BEC — 更改银行账户)
- CEO 欺诈 / 高管身份冒充
- WhatsApp 账户盗窃 (OTP 骗局)
- 虚假包裹通知 (Mercado Libre, DHL, FedEx, Estafeta)
- 虚假服务收费 (CFE, Telmex, Megacable)
- 虚拟绑架 / 企业勒索
- 加密货币骗局、恋爱诈骗、虚假工作机会
- URL 中的拼写错误劫持
多模态分析:**文本、URL 和截图**(图像)。
## 仓库结构
```
sabuezo/
├── README.md
├── .gitignore
├── .env.example # template de variables
├── bot/ # Bot WhatsApp (Node + Baileys)
│ ├── package.json
│ └── index.js
├── backend/ # API y análisis (Python + FastAPI)
│ ├── requirements.txt
│ ├── main.py
│ ├── db.py # cliente Supabase
│ ├── analyzers/
│ │ ├── text.py # Claude Haiku + heurísticas MX
│ │ ├── image.py # Claude Sonnet vision
│ │ ├── url.py # typosquatting + WHOIS + TLD
│ │ └── scanner.py # site security scanner
│ └── data/
│ └── corpus.json # corpus de estafas mexicanas
├── frontend/ # Next.js 16 (deployado en Vercel)
│ ├── app/
│ │ ├── page.tsx # landing
│ │ ├── escanear/page.tsx # escáner público
│ │ ├── p/[id]/page.tsx # dashboard PyME
│ │ ├── api/scan/route.ts # proxy server-only al backend
│ │ ├── icon.png # favicon
│ │ ├── apple-icon.png
│ │ └── opengraph-image.png
│ └── lib/
└── scripts/ # Helpers (schema migration, tests)
├── 01_schema.sql
└── apply_schema.py
```
## 如何运行
### 前提条件
- Node 18+ 和 npm
- Python 3.11+
- Anthropic 账户 (API 密钥)
- Supabase 项目 (URL + service key + publishable key)
- 一个用于机器人的专用 WhatsApp 号码
### 1. 设置
```
git clone https://github.com/Avzolem/sabuezo.git
cd sabuezo
cp .env.example .env
# 编辑 .env 文件并填入你的密钥
```
### 2. Supabase 数据库结构
```
# 将 scripts/01_schema.sql 粘贴到 Supabase SQL Editor 中
# 或使用:
SUPABASE_DB_PASSWORD="..." python3 scripts/apply_schema.py
```
### 3. 后端
```
cd backend
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
python main.py # corre en :8787
```
### 4. WhatsApp 机器人
```
cd bot
npm install
npm start
# 用你的专用 WhatsApp 号码扫描二维码
```
### 5. 前端
```
cd frontend
cp .env.local.example .env.local # rellena con NEXT_PUBLIC_* vars
npm install
npm run dev # corre en :3000
```
### 部署到生产环境
- **机器人 + 后端**:在任何 Linux 服务器上使用 `pm2` 运行。通过 Cloudflare Tunnel 暴露后端 (`cloudflared tunnel --url http://localhost:8787`) 或使用 named tunnel 以获得固定 URL。
- **前端**:部署到 Vercel (`vercel --prod`)。在 Vercel 控制台中配置环境变量,包括 `INTERNAL_API_URL`(tunnel URL)和 `INTERNAL_API_TOKEN`。
## 为什么采用这种方法
- **WhatsApp 是拉丁美洲用户的主场**,而不是需要额外安装的应用
- **多模态**:人们转发截图、语音消息、屏幕捕获——而不仅仅是文本
- **语义检测** vs 规则:Claude 能读取正则表达式无法捕捉的模式(缺少重音、警报中缺少最后4位数字的"BBVA"等)
- **墨西哥本地化背景**:SAT, CFDI, 本地银行、惯用语。英文的通用检测器在这里不起作用
- **跨领域洞察**:同类首个产品,将收到的钓鱼邮件与域名邮箱配置联系起来,解释其根源
## 黑客松
为 [hack@latam 2026](https://hack.indies.la/) (5月15-17日,indies.la) 构建的项目,**DEF/ACC** 赛道。由 [Andrés Aguilar](https://github.com/Avzolem) 在 24 小时内构建。
## 许可证
MIT — 使用它,复刻它,改进它。
标签:AES-256, AI分析, AMSI绕过, DKIM配置, DMARC配置, MITM代理, SPF配置, SSL检测, WhatsApp机器人, 中小企业安全, 反欺诈, 威胁检测, 安全诊断, 拉丁美洲市场, 漏洞评估, 目录枚举, 移动安全, 结构化查询, 网站安全扫描, 网络安全, 网络诈骗防范, 自动化安全, 自动化攻击, 西班牙语服务, 逆向工具, 邮件安全, 钓鱼防护, 隐私保护