tshriraj-del/redwing-fraud-os

GitHub: tshriraj-del/redwing-fraud-os

基于 XGBoost、LLM 和网络图谱分析的一体化 AI 反欺诈平台，提供实时交易评分、自主欺诈检测 agent 和自动规则生成能力。

Stars: 1 | Forks: 0

# RedWing — AI 反欺诈平台 ![RedWing 平台](https://img.shields.io/badge/RedWing-AI%20Fraud%20Platform-818cf8?style=for-the-badge) ![技术栈](https://img.shields.io/badge/Stack-React%20%7C%20FastAPI%20%7C%20XGBoost%20%7C%20LLM-0ea5e9?style=for-the-badge) ![AUC](https://img.shields.io/badge/Ensemble%20AUC-0.979-22c55e?style=for-the-badge) ![交易量](https://img.shields.io/badge/Training%20Data-880K%20transactions-f59e0b?style=for-the-badge) ## 什么是 RedWing？大多数反欺诈平台只能对已经发生的欺诈行为做出反应。**RedWing 从尚未发生的欺诈中进行学习** —— 它运行一个自主的 AI agent，可以实时检测并拦截 AI 驱动的欺诈行为，每晚针对新型模式进行重新训练，并在欺诈者对生产环境造成影响之前自动生成规则。它结合了： - **监督学习与无监督学习 ML**，用于交易评分（XGBoost + IsolationForest，AUC 0.979） - **自主 AI 欺诈 agent**，可检测测卡机器人、ATO 机器人、深度伪造、撞库、合成身份农场和对抗性 ML 攻击 —— 实时、7x24 小时不间断 - **LLM 驱动的规则生成**，自动弥合 ML 与规则之间的差距 - **实时网络图谱分析**，用于欺诈团伙检测 - **AI 调查副驾驶**，用于结构化案件分析 - **符合欧盟《人工智能法案》(EU AI Act) 第 14 条**，支持人工介入的案件审查所有五个分析师工具都连接在一个统一的指挥中心中，并共享同一个反馈闭环。 ## 架构 ``` ┌─────────────────────────────────────────────────────────────────┐ │ Fraud OS (port 5173) │ │ Unified AI Command Center │ │ Dashboard · FraudSense · RuleBreaker · SyntheticID Agent │ │ XAI Lab · SAR Writer · ML Detection Lab · Network Intel │ └──────────────────────────┬──────────────────────────────────────┘ │ HTTP + SSE ▼ ┌────────────────────────────────┐ │ RedWing Operator (port 8000) │ │ XGBoost scoring · Rule Factory │ │ Autonomous Agent · LLM proxy │ │ Network graph · XAI engine │ └────────────────────────────────┘ ``` 所有 LLM 调用均通过 operator 后端进行路由 —— 浏览器中不保存任何 API 密钥。 ### 四层评分流水线每笔交易在做出决策之前都会经历四个层的处理： | 层级 | 权重 | 功能描述 | |---|---|---| | 规则引擎 | 40% | 覆盖 6 种欺诈类型的 41 条规则 | | ML 集成模型 | 45% | XGBoost (70%) + IsolationForest (30%) | | 行为基线 | 15% | 30/60/90 天滚动用户画像 | | 支付通道阈值 | 覆盖 | 针对 Crypto、FedNow、RTP、Zelle 的特定拦截规则 | **输出结果：** `APPROVE`（批准） / `REVIEW`（审核） / `ESCALATE`（升级） / `DECLINE`（拒绝） ## 自我改进闭环 ``` SyntheticID Agent detects novel AI fraud pattern ↓ novel_attack_buffer fills (10 events) Rule Factory triggered: gap extraction → LLM analysis → candidate rules ↓ backtest against 880K transactions Quality gate: precision > 78% → auto-deploy | > 55% → shadow | else → reject ↓ rule coverage improves Agent encounters narrowed attack surface → repeat ``` 其他所有平台都是基于历史已确认的欺诈行为进行训练。而 RedWing 能够为尚未发生的欺诈生成规则。 ## 分析师工具 ### Dashboard（仪表盘）指挥中心概览 —— 实时 ML 指标（AUC、欺诈率、规则漏洞）、五工具启动器、活动信息流。 ### SyntheticID Agent 由 XGBoost ML 模型提供支持的自主 AI 欺诈检测 agent。7x24 小时运行，将每笔交易分为 7 种威胁类型（测卡机器人、ATO 机器人、深度伪造绕过、撞库、合成身份农场、对抗性 ML、正常），并实时做出拦截/标记/放行决策。具备自我学习能力：新型攻击集群会触发 Rule Factory 自动生成并部署新规则。分析师控制中心包括： - **实时信息流** —— 通过 SSE 流式传输的拦截决策及 AI 信号细分 - **案件审查** —— 针对被标记交易的 Human-in-the-loop 队列（符合欧盟《人工智能法案》第 14 条） - **Agent 设置** —— 全局阈值、针对各威胁类型的控制、速度，以及 5 个特殊开关（高度警戒模式、零容忍机器人、自学习、要求人工审查、自动部署规则） **技术栈：** FastAPI · XGBoost · asyncio SSE · React ### FraudSense 由 LLM 驱动的欺诈调查副驾驶。提交欺诈案件，即可获得结构化的 4 阶段调查：风险评分（0-100）、信号分析、欺诈分类、损失预估、根本原因以及建议的操作。 **技术栈：** React · LLM proxy (operator 后端) ### RuleBreaker 对抗性规则压力测试工具。针对边缘情况和对抗性输入测试现有的欺诈规则，以便在它们进入生产环境之前发现检测漏洞。 **技术栈：** React · LLM proxy ### XAI Lab 可解释 AI 层。SHAP 特征归因、模型漂移监控、欧盟《人工智能法案》第 13 条透明度报告、SR 26-02 模型风险治理工件。 **技术栈：** React · FastAPI · SHAP ### SAR Writer 用于符合 BSA/AML 规定的 FinCEN 表格 111 SAR 叙述生成器。包含 5-W 合规检查器、13 种欺诈类型、支持初始/后续/更正申报类型。 **技术栈：** React · LLM proxy ### ML Detection Lab 训练并部署核心欺诈评分引擎。XGBoost 监督学习分类 + IsolationForest 无监督异常检测。SHAP 值为每一次预测提供解释。 **核心数据：** - 880,719 笔交易（855K 来自 Kaggle + 25K 合成欺诈数据行） - 23 个特征：速度（1h/4h/24h/7d/30d）、行为偏差、支付通道风险、收款人/设备熟悉度 - 集成模型 AUC：**0.979** **技术栈：** Python · XGBoost · IsolationForest · scikit-learn · SHAP · KMeans ### Network Intelligence 实时欺诈团伙检测图谱。将用户、设备和收款人可视化为节点，将交易可视化为边。自动浮现共享的设备和骡子账户。 - 标记了 39 个共享设备（相同硬件，关联 3 个以上用户账户） - 标记了 285 个骡子账户（接收过 5 笔以上欺诈交易的账户） **技术栈：** React · react-force-graph-2d · D3 · FastAPI · pandas ## 覆盖的欺诈类型 | 欺诈类型 | 描述 | |---|---| | 测卡机器人 | 大规模自动化探测信用卡有效性及额度 | | ATO 机器人 | LLM 辅助的撞库 + 账户接管 | | 合成身份农场 | 伪造 PII + 真实 SSN，经过长期养号后进行变现 | | 深度伪造绕过 | 使用合成语音/视频来授权转账 | | 撞库 | 利用数据泄露 dump 的凭证进行大规模重放攻击 | | 对抗性 ML | 专门为绕过 ML 模型而构造的输入 | | 杀猪盘 | 长期关系诈骗 → 加密货币投资骗局 | | APP 骗局 | 通过社会工程学进行的授权推送支付欺诈 | ## 技术栈 | 分类 | 技术 | |---|---| | ML / 数据 | Python, XGBoost, IsolationForest, scikit-learn, SHAP, KMeans, pandas, numpy | | LLM | 仅通过 operator 后端的 LLM proxy 在服务端运行 | | 后端 | FastAPI, uvicorn, asyncio SSE 流式传输 | | 前端 | React 18, Vite, Tailwind CSS, React Router v6 | | 可视化 | Recharts（指标/漂移），react-force-graph-2d + D3（网络图谱） | | 数据 | 880,719 笔交易，Jupyter notebook ML pipeline | ## 本地运行 ### 前置条件 - Node 18+，Python 3.9+ - LLM API 密钥（Anthropic, OpenAI, Groq 或 Mistral） ### 1. ML 模型（一次性设置） ``` # 运行 ML Fraud Engine notebook jupyter notebook "ML Fraud Engine.ipynb" # 运行所有单元格 — 训练 XGBoost + IsoForest，保存到 ~/pulseml_models/ ``` ### 2. Operator 后端（端口 8000） ``` cd operator echo "ANTHROPIC_API_KEY=your_key_here" > .env python3 -m uvicorn main:app --port 8000 --reload ``` operator 提供 ML 评分、自主 SyntheticID agent、Rule Factory、网络图谱、XAI 引擎以及 LLM proxy 服务。 ### 3. Fraud OS Dashboard（端口 5173） ``` cd fraud-os npm install npm run dev # 打开 http://localhost:5173 ``` ## 规模 | 指标 | 数值 | |---|---| | 训练交易量 | 880,719 | | ML 特征 | 23 | | 欺诈检测规则 | 41 条 + 自动生成的规则 | | 威胁类型（自主 agent） | 7 | | AI 行为信号 | 5 | | 集成模型 AUC | 0.979 | | 检测到的共享设备 | 39 | | 检测到的骡子账户 | 285 | | 后端端口 | 8000（单一 operator 服务） | *仅用于防御和研究目的。*

标签：Apex, AV绕过, FastAPI, React, Syscalls, XGBoost, 反欺诈系统, 图神经网络, 机器学习, 自定义脚本, 金融风控