tshriraj-del/redwing-fraud-os

GitHub: tshriraj-del/redwing-fraud-os

基于 XGBoost、LLM 和网络图谱分析的一体化 AI 反欺诈平台,提供实时交易评分、自主欺诈检测 agent 和自动规则生成能力。

Stars: 0 | Forks: 0

# RedWing — AI 反欺诈平台 ![RedWing 平台](https://img.shields.io/badge/RedWing-AI%20Fraud%20Platform-818cf8?style=for-the-badge) ![技术栈](https://img.shields.io/badge/Stack-React%20%7C%20FastAPI%20%7C%20XGBoost%20%7C%20LLM-0ea5e9?style=for-the-badge) ![AUC](https://img.shields.io/badge/Ensemble%20AUC-0.979-22c55e?style=for-the-badge) ![交易量](https://img.shields.io/badge/Training%20Data-880K%20transactions-f59e0b?style=for-the-badge) ## 什么是 RedWing? 大多数反欺诈平台只能对已经发生的欺诈行为做出反应。**RedWing 从尚未发生的欺诈中进行学习** —— 它运行一个自主的 AI agent,可以实时检测并拦截 AI 驱动的欺诈行为,每晚针对新型模式进行重新训练,并在欺诈者对生产环境造成影响之前自动生成规则。 它结合了: - **监督学习与无监督学习 ML**,用于交易评分(XGBoost + IsolationForest,AUC 0.979) - **自主 AI 欺诈 agent**,可检测测卡机器人、ATO 机器人、深度伪造、撞库、合成身份农场和对抗性 ML 攻击 —— 实时、7x24 小时不间断 - **LLM 驱动的规则生成**,自动弥合 ML 与规则之间的差距 - **实时网络图谱分析**,用于欺诈团伙检测 - **AI 调查副驾驶**,用于结构化案件分析 - **符合欧盟《人工智能法案》(EU AI Act) 第 14 条**,支持人工介入的案件审查 所有五个分析师工具都连接在一个统一的指挥中心中,并共享同一个反馈闭环。 ## 架构 ``` ┌─────────────────────────────────────────────────────────────────┐ │ Fraud OS (port 5173) │ │ Unified AI Command Center │ │ Dashboard · FraudSense · RuleBreaker · SyntheticID Agent │ │ XAI Lab · SAR Writer · ML Detection Lab · Network Intel │ └──────────────────────────┬──────────────────────────────────────┘ │ HTTP + SSE ▼ ┌────────────────────────────────┐ │ RedWing Operator (port 8000) │ │ XGBoost scoring · Rule Factory │ │ Autonomous Agent · LLM proxy │ │ Network graph · XAI engine │ └────────────────────────────────┘ ``` 所有 LLM 调用均通过 operator 后端进行路由 —— 浏览器中不保存任何 API 密钥。 ### 四层评分流水线 每笔交易在做出决策之前都会经历四个层的处理: | 层级 | 权重 | 功能描述 | |---|---|---| | 规则引擎 | 40% | 覆盖 6 种欺诈类型的 41 条规则 | | ML 集成模型 | 45% | XGBoost (70%) + IsolationForest (30%) | | 行为基线 | 15% | 30/60/90 天滚动用户画像 | | 支付通道阈值 | 覆盖 | 针对 Crypto、FedNow、RTP、Zelle 的特定拦截规则 | **输出结果:** `APPROVE`(批准) / `REVIEW`(审核) / `ESCALATE`(升级) / `DECLINE`(拒绝) ## 自我改进闭环 ``` SyntheticID Agent detects novel AI fraud pattern ↓ novel_attack_buffer fills (10 events) Rule Factory triggered: gap extraction → LLM analysis → candidate rules ↓ backtest against 880K transactions Quality gate: precision > 78% → auto-deploy | > 55% → shadow | else → reject ↓ rule coverage improves Agent encounters narrowed attack surface → repeat ``` 其他所有平台都是基于历史已确认的欺诈行为进行训练。而 RedWing 能够为尚未发生的欺诈生成规则。 ## 分析师工具 ### Dashboard(仪表盘) 指挥中心概览 —— 实时 ML 指标(AUC、欺诈率、规则漏洞)、五工具启动器、活动信息流。 ### SyntheticID Agent 由 XGBoost ML 模型提供支持的自主 AI 欺诈检测 agent。7x24 小时运行,将每笔交易分为 7 种威胁类型(测卡机器人、ATO 机器人、深度伪造绕过、撞库、合成身份农场、对抗性 ML、正常),并实时做出拦截/标记/放行决策。具备自我学习能力:新型攻击集群会触发 Rule Factory 自动生成并部署新规则。 分析师控制中心包括: - **实时信息流** —— 通过 SSE 流式传输的拦截决策及 AI 信号细分 - **案件审查** —— 针对被标记交易的 Human-in-the-loop 队列(符合欧盟《人工智能法案》第 14 条) - **Agent 设置** —— 全局阈值、针对各威胁类型的控制、速度,以及 5 个特殊开关(高度警戒模式、零容忍机器人、自学习、要求人工审查、自动部署规则) **技术栈:** FastAPI · XGBoost · asyncio SSE · React ### FraudSense 由 LLM 驱动的欺诈调查副驾驶。提交欺诈案件,即可获得结构化的 4 阶段调查:风险评分(0-100)、信号分析、欺诈分类、损失预估、根本原因以及建议的操作。 **技术栈:** React · LLM proxy (operator 后端) ### RuleBreaker 对抗性规则压力测试工具。针对边缘情况和对抗性输入测试现有的欺诈规则,以便在它们进入生产环境之前发现检测漏洞。 **技术栈:** React · LLM proxy ### XAI Lab 可解释 AI 层。SHAP 特征归因、模型漂移监控、欧盟《人工智能法案》第 13 条透明度报告、SR 26-02 模型风险治理工件。 **技术栈:** React · FastAPI · SHAP ### SAR Writer 用于符合 BSA/AML 规定的 FinCEN 表格 111 SAR 叙述生成器。包含 5-W 合规检查器、13 种欺诈类型、支持初始/后续/更正申报类型。 **技术栈:** React · LLM proxy ### ML Detection Lab 训练并部署核心欺诈评分引擎。XGBoost 监督学习分类 + IsolationForest 无监督异常检测。SHAP 值为每一次预测提供解释。 **核心数据:** - 880,719 笔交易(855K 来自 Kaggle + 25K 合成欺诈数据行) - 23 个特征:速度(1h/4h/24h/7d/30d)、行为偏差、支付通道风险、收款人/设备熟悉度 - 集成模型 AUC:**0.979** **技术栈:** Python · XGBoost · IsolationForest · scikit-learn · SHAP · KMeans ### Network Intelligence 实时欺诈团伙检测图谱。将用户、设备和收款人可视化为节点,将交易可视化为边。自动浮现共享的设备和骡子账户。 - 标记了 39 个共享设备(相同硬件,关联 3 个以上用户账户) - 标记了 285 个骡子账户(接收过 5 笔以上欺诈交易的账户) **技术栈:** React · react-force-graph-2d · D3 · FastAPI · pandas ## 覆盖的欺诈类型 | 欺诈类型 | 描述 | |---|---| | 测卡机器人 | 大规模自动化探测信用卡有效性及额度 | | ATO 机器人 | LLM 辅助的撞库 + 账户接管 | | 合成身份农场 | 伪造 PII + 真实 SSN,经过长期养号后进行变现 | | 深度伪造绕过 | 使用合成语音/视频来授权转账 | | 撞库 | 利用数据泄露 dump 的凭证进行大规模重放攻击 | | 对抗性 ML | 专门为绕过 ML 模型而构造的输入 | | 杀猪盘 | 长期关系诈骗 → 加密货币投资骗局 | | APP 骗局 | 通过社会工程学进行的授权推送支付欺诈 | ## 技术栈 | 分类 | 技术 | |---|---| | ML / 数据 | Python, XGBoost, IsolationForest, scikit-learn, SHAP, KMeans, pandas, numpy | | LLM | 仅通过 operator 后端的 LLM proxy 在服务端运行 | | 后端 | FastAPI, uvicorn, asyncio SSE 流式传输 | | 前端 | React 18, Vite, Tailwind CSS, React Router v6 | | 可视化 | Recharts(指标/漂移),react-force-graph-2d + D3(网络图谱) | | 数据 | 880,719 笔交易,Jupyter notebook ML pipeline | ## 本地运行 ### 前置条件 - Node 18+,Python 3.9+ - LLM API 密钥(Anthropic, OpenAI, Groq 或 Mistral) ### 1. ML 模型(一次性设置) ``` # 运行 ML Fraud Engine notebook jupyter notebook "ML Fraud Engine.ipynb" # 运行所有单元格 — 训练 XGBoost + IsoForest,保存到 ~/pulseml_models/ ``` ### 2. Operator 后端(端口 8000) ``` cd operator echo "ANTHROPIC_API_KEY=your_key_here" > .env python3 -m uvicorn main:app --port 8000 --reload ``` operator 提供 ML 评分、自主 SyntheticID agent、Rule Factory、网络图谱、XAI 引擎以及 LLM proxy 服务。 ### 3. Fraud OS Dashboard(端口 5173) ``` cd fraud-os npm install npm run dev # 打开 http://localhost:5173 ``` ## 规模 | 指标 | 数值 | |---|---| | 训练交易量 | 880,719 | | ML 特征 | 23 | | 欺诈检测规则 | 41 条 + 自动生成的规则 | | 威胁类型(自主 agent) | 7 | | AI 行为信号 | 5 | | 集成模型 AUC | 0.979 | | 检测到的共享设备 | 39 | | 检测到的骡子账户 | 285 | | 后端端口 | 8000(单一 operator 服务) | *仅用于防御和研究目的。*
标签:Apex, AV绕过, FastAPI, React, Syscalls, XGBoost, 反欺诈系统, 图神经网络, 机器学习, 自定义脚本, 金融风控