tshriraj-del/redwing-fraud-os
GitHub: tshriraj-del/redwing-fraud-os
基于 XGBoost、LLM 和网络图谱分析的一体化 AI 反欺诈平台,提供实时交易评分、自主欺诈检测 agent 和自动规则生成能力。
Stars: 0 | Forks: 0
# RedWing — AI 反欺诈平台




## 什么是 RedWing?
大多数反欺诈平台只能对已经发生的欺诈行为做出反应。**RedWing 从尚未发生的欺诈中进行学习** —— 它运行一个自主的 AI agent,可以实时检测并拦截 AI 驱动的欺诈行为,每晚针对新型模式进行重新训练,并在欺诈者对生产环境造成影响之前自动生成规则。
它结合了:
- **监督学习与无监督学习 ML**,用于交易评分(XGBoost + IsolationForest,AUC 0.979)
- **自主 AI 欺诈 agent**,可检测测卡机器人、ATO 机器人、深度伪造、撞库、合成身份农场和对抗性 ML 攻击 —— 实时、7x24 小时不间断
- **LLM 驱动的规则生成**,自动弥合 ML 与规则之间的差距
- **实时网络图谱分析**,用于欺诈团伙检测
- **AI 调查副驾驶**,用于结构化案件分析
- **符合欧盟《人工智能法案》(EU AI Act) 第 14 条**,支持人工介入的案件审查
所有五个分析师工具都连接在一个统一的指挥中心中,并共享同一个反馈闭环。
## 架构
```
┌─────────────────────────────────────────────────────────────────┐
│ Fraud OS (port 5173) │
│ Unified AI Command Center │
│ Dashboard · FraudSense · RuleBreaker · SyntheticID Agent │
│ XAI Lab · SAR Writer · ML Detection Lab · Network Intel │
└──────────────────────────┬──────────────────────────────────────┘
│ HTTP + SSE
▼
┌────────────────────────────────┐
│ RedWing Operator (port 8000) │
│ XGBoost scoring · Rule Factory │
│ Autonomous Agent · LLM proxy │
│ Network graph · XAI engine │
└────────────────────────────────┘
```
所有 LLM 调用均通过 operator 后端进行路由 —— 浏览器中不保存任何 API 密钥。
### 四层评分流水线
每笔交易在做出决策之前都会经历四个层的处理:
| 层级 | 权重 | 功能描述 |
|---|---|---|
| 规则引擎 | 40% | 覆盖 6 种欺诈类型的 41 条规则 |
| ML 集成模型 | 45% | XGBoost (70%) + IsolationForest (30%) |
| 行为基线 | 15% | 30/60/90 天滚动用户画像 |
| 支付通道阈值 | 覆盖 | 针对 Crypto、FedNow、RTP、Zelle 的特定拦截规则 |
**输出结果:** `APPROVE`(批准) / `REVIEW`(审核) / `ESCALATE`(升级) / `DECLINE`(拒绝)
## 自我改进闭环
```
SyntheticID Agent detects novel AI fraud pattern
↓ novel_attack_buffer fills (10 events)
Rule Factory triggered: gap extraction → LLM analysis → candidate rules
↓ backtest against 880K transactions
Quality gate: precision > 78% → auto-deploy | > 55% → shadow | else → reject
↓ rule coverage improves
Agent encounters narrowed attack surface → repeat
```
其他所有平台都是基于历史已确认的欺诈行为进行训练。而 RedWing 能够为尚未发生的欺诈生成规则。
## 分析师工具
### Dashboard(仪表盘)
指挥中心概览 —— 实时 ML 指标(AUC、欺诈率、规则漏洞)、五工具启动器、活动信息流。
### SyntheticID Agent
由 XGBoost ML 模型提供支持的自主 AI 欺诈检测 agent。7x24 小时运行,将每笔交易分为 7 种威胁类型(测卡机器人、ATO 机器人、深度伪造绕过、撞库、合成身份农场、对抗性 ML、正常),并实时做出拦截/标记/放行决策。具备自我学习能力:新型攻击集群会触发 Rule Factory 自动生成并部署新规则。
分析师控制中心包括:
- **实时信息流** —— 通过 SSE 流式传输的拦截决策及 AI 信号细分
- **案件审查** —— 针对被标记交易的 Human-in-the-loop 队列(符合欧盟《人工智能法案》第 14 条)
- **Agent 设置** —— 全局阈值、针对各威胁类型的控制、速度,以及 5 个特殊开关(高度警戒模式、零容忍机器人、自学习、要求人工审查、自动部署规则)
**技术栈:** FastAPI · XGBoost · asyncio SSE · React
### FraudSense
由 LLM 驱动的欺诈调查副驾驶。提交欺诈案件,即可获得结构化的 4 阶段调查:风险评分(0-100)、信号分析、欺诈分类、损失预估、根本原因以及建议的操作。
**技术栈:** React · LLM proxy (operator 后端)
### RuleBreaker
对抗性规则压力测试工具。针对边缘情况和对抗性输入测试现有的欺诈规则,以便在它们进入生产环境之前发现检测漏洞。
**技术栈:** React · LLM proxy
### XAI Lab
可解释 AI 层。SHAP 特征归因、模型漂移监控、欧盟《人工智能法案》第 13 条透明度报告、SR 26-02 模型风险治理工件。
**技术栈:** React · FastAPI · SHAP
### SAR Writer
用于符合 BSA/AML 规定的 FinCEN 表格 111 SAR 叙述生成器。包含 5-W 合规检查器、13 种欺诈类型、支持初始/后续/更正申报类型。
**技术栈:** React · LLM proxy
### ML Detection Lab
训练并部署核心欺诈评分引擎。XGBoost 监督学习分类 + IsolationForest 无监督异常检测。SHAP 值为每一次预测提供解释。
**核心数据:**
- 880,719 笔交易(855K 来自 Kaggle + 25K 合成欺诈数据行)
- 23 个特征:速度(1h/4h/24h/7d/30d)、行为偏差、支付通道风险、收款人/设备熟悉度
- 集成模型 AUC:**0.979**
**技术栈:** Python · XGBoost · IsolationForest · scikit-learn · SHAP · KMeans
### Network Intelligence
实时欺诈团伙检测图谱。将用户、设备和收款人可视化为节点,将交易可视化为边。自动浮现共享的设备和骡子账户。
- 标记了 39 个共享设备(相同硬件,关联 3 个以上用户账户)
- 标记了 285 个骡子账户(接收过 5 笔以上欺诈交易的账户)
**技术栈:** React · react-force-graph-2d · D3 · FastAPI · pandas
## 覆盖的欺诈类型
| 欺诈类型 | 描述 |
|---|---|
| 测卡机器人 | 大规模自动化探测信用卡有效性及额度 |
| ATO 机器人 | LLM 辅助的撞库 + 账户接管 |
| 合成身份农场 | 伪造 PII + 真实 SSN,经过长期养号后进行变现 |
| 深度伪造绕过 | 使用合成语音/视频来授权转账 |
| 撞库 | 利用数据泄露 dump 的凭证进行大规模重放攻击 |
| 对抗性 ML | 专门为绕过 ML 模型而构造的输入 |
| 杀猪盘 | 长期关系诈骗 → 加密货币投资骗局 |
| APP 骗局 | 通过社会工程学进行的授权推送支付欺诈 |
## 技术栈
| 分类 | 技术 |
|---|---|
| ML / 数据 | Python, XGBoost, IsolationForest, scikit-learn, SHAP, KMeans, pandas, numpy |
| LLM | 仅通过 operator 后端的 LLM proxy 在服务端运行 |
| 后端 | FastAPI, uvicorn, asyncio SSE 流式传输 |
| 前端 | React 18, Vite, Tailwind CSS, React Router v6 |
| 可视化 | Recharts(指标/漂移),react-force-graph-2d + D3(网络图谱) |
| 数据 | 880,719 笔交易,Jupyter notebook ML pipeline |
## 本地运行
### 前置条件
- Node 18+,Python 3.9+
- LLM API 密钥(Anthropic, OpenAI, Groq 或 Mistral)
### 1. ML 模型(一次性设置)
```
# 运行 ML Fraud Engine notebook
jupyter notebook "ML Fraud Engine.ipynb"
# 运行所有单元格 — 训练 XGBoost + IsoForest,保存到 ~/pulseml_models/
```
### 2. Operator 后端(端口 8000)
```
cd operator
echo "ANTHROPIC_API_KEY=your_key_here" > .env
python3 -m uvicorn main:app --port 8000 --reload
```
operator 提供 ML 评分、自主 SyntheticID agent、Rule Factory、网络图谱、XAI 引擎以及 LLM proxy 服务。
### 3. Fraud OS Dashboard(端口 5173)
```
cd fraud-os
npm install
npm run dev
# 打开 http://localhost:5173
```
## 规模
| 指标 | 数值 |
|---|---|
| 训练交易量 | 880,719 |
| ML 特征 | 23 |
| 欺诈检测规则 | 41 条 + 自动生成的规则 |
| 威胁类型(自主 agent) | 7 |
| AI 行为信号 | 5 |
| 集成模型 AUC | 0.979 |
| 检测到的共享设备 | 39 |
| 检测到的骡子账户 | 285 |
| 后端端口 | 8000(单一 operator 服务) |
*仅用于防御和研究目的。*
标签:Apex, AV绕过, FastAPI, React, Syscalls, XGBoost, 反欺诈系统, 图神经网络, 机器学习, 自定义脚本, 金融风控