aditi-reddy/auditmind-poc

GitHub: aditi-reddy/auditmind-poc

一个用于电商欺诈检测的多智能体概念验证,演示从模式识别到风险评分与审计输出的完整流程。

Stars: 0 | Forks: 0

# AuditMind POC **一个用于2026年Deloitte Digital Elite Challenge(团队I)的可运行概念验证。** 此仓库是我提交提案的配套实现。它是一个最小但真实的项目,展示了提交文档中描述的多智能体欺诈检测流水线:模式智能体 → 风险智能体 → 告警智能体,在包含伪造刷单团伙的模拟电商数据集上运行。 它不是完整的AuditMind系统。这是我能真正构建出一个系统的证明。 ## 它做什么 1. 生成50笔模拟交易(40笔正常 + 10笔协同欺诈) 2. **模式智能体**构建网络图并扫描刷单特征签名 3. **风险智能体**使用透明的多因子公式对每个被标记的簇进行评分 4. **告警智能体**生成Markdown审计报告并将检测到的团伙渲染为PNG图 全部代码控制在300行Python以内。所有内容均可复现。 ## 如何运行 ``` pip install -r requirements.txt python generate_mock_data.py python run_pipeline.py ``` 输出: - `output/audit_report.md` — 人类可读的审计报告 - `output/gang_graph.png` — 检测到的欺诈网络可视化 ## 在模拟数据集上的示例输出 ``` Loaded 50 transactions. Built network graph with 203 nodes and 191 edges. Detected 1 suspicious cluster(s). Cluster on IP 192.168.10.42 → score 0.865 (HIGH) Accounts: 10 (10 young) Time window: 3.37 minutes SKU: SKU-PREMWATCH-7829 Seller: SELLER-FRAUD-X Total amount: $5043.95 ``` 系统正确识别了被植入的10账户团伙,并为其分配了**高风险**等级,建议立即进行人工审计复核。 ## 检测逻辑(模式智能体) 图中包含四种节点类型和四种边类型: | 节点 | 含义 | |---|---| | Account | 买家账户 | | IP | IP地址 | | Device | 设备指纹 | | SKU | 购买的商品 | | Seller | 接收收入的卖家 | 当一个簇满足以下条件时会被标记: - **4个或更多账户**共享同一IP地址 - 所有账户购买**同一SKU** - 时间窗口在**10分钟以内** - **大多数账户注册时间不到7天** 此规则捕捉了核心协同刷单特征。在完整的AuditMind系统中,该基于规则的扫描将被一个在标记欺诈案例上训练的RGCN(关系图卷积网络)所替代。对于概念验证,透明规则更有用,因为每个被标记的案例都可以用一句话向审计员解释清楚。 ## 评分逻辑(风险智能体) 分数是三个因子的加权和,每个因子归一化到[0, 1]: ``` score = 0.40 * time_factor (tighter burst = higher risk) + 0.30 * ip_factor (more accounts on one IP = higher risk) + 0.30 * age_factor (younger accounts = higher risk) ``` 阈值: | 分数 | 等级 | 动作 | |---|---|---| | > 0.80 | 高风险 | 需要人工审计复核 | | 0.40 到 0.80 | 中风险 | 加入每日批量审核队列 | | < 0.40 | 低风险 | 自动批准并保留审计轨迹 | 这是提案中提出的人机协同(HITL)模式。不会在不经过人工确认的情况下对账户采取任何操作。 ## 这如何与完整的AuditMind提案衔接 此概念验证是楔入的一角。它所证明的部分包括: - **数据摄取**:我可以加载、清洗并结构化交易数据(基于我现有的个人财务流水线) - **模式识别**:我可以构建图并检测跨账户的协同模式 - **风险评估**:我可以将多个信号组合成一个可解释的单一分值 - **告警输出**:我可以生成审计级别、人类真正会使用的输出 - **HITL**:路由逻辑将需要人工介入的部分与不需要的部分分离 **不在本概念验证中的部分**,这些将在决赛阶段构建: - 在真实标记数据上训练的RGCN模型(取代基于规则的扫描) - 用于自然语言审计叙述的LLM集成(告警智能体) - 三层记忆系统(工作记忆、情景记忆、语义记忆)并具备真实持久化 - 钉钉/Slack Webhook 推送 - 面向中国企业的本地部署方案 ## 仓库结构 ``` auditmind-poc/ ├── README.md this file ├── requirements.txt pandas, networkx, matplotlib, numpy ├── generate_mock_data.py creates 50-row test dataset ├── pattern_agent.py graph construction + detection ├── risk_agent.py multi-factor scoring ├── alert_agent.py report generation + visualization ├── run_pipeline.py end-to-end runner ├── data/ │ └── transactions.csv generated dataset └── output/ ├── audit_report.md generated report └── gang_graph.png generated network visualization ``` ## 作者 **Aditi Malla** 中央密歇根大学,信息系统硕士 提交至2026年Deloitte Digital Elite Challenge,团队I(导师:Leo Ma) - GitHub: [github.com/aditi-reddy](https://github.com/aditi-reddy) - 基础项目:个人财务流水线 [personal-finance-pipeline](https://github.com/aditi-reddy/personal-finance-pipeline) - LinkedIn: [linkedin.com/in/aditi-reddy-malla-275a70222](https://www.linkedin.com/in/aditi-reddy-malla-275a70222/) ## 许可证 本项目提交至Deloitte Digital Elite Challenge 2026。所有代码均为原创作品。
标签:DEMO, Pipeline, Proof of Concept, PyRIT, Python, 刷单检测, 可重现, 团队协作, 图网络, 多智能体系统, 审计思维, 审计报告, 异常检测, 挑战赛, 无后门, 模式识别, 欺诈检测, 电商反欺诈, 网络图分析, 逆向工具, 透明公式, 风险评分