aditi-reddy/auditmind-poc
GitHub: aditi-reddy/auditmind-poc
一个用于电商欺诈检测的多智能体概念验证,演示从模式识别到风险评分与审计输出的完整流程。
Stars: 0 | Forks: 0
# AuditMind POC
**一个用于2026年Deloitte Digital Elite Challenge(团队I)的可运行概念验证。**
此仓库是我提交提案的配套实现。它是一个最小但真实的项目,展示了提交文档中描述的多智能体欺诈检测流水线:模式智能体 → 风险智能体 → 告警智能体,在包含伪造刷单团伙的模拟电商数据集上运行。
它不是完整的AuditMind系统。这是我能真正构建出一个系统的证明。
## 它做什么
1. 生成50笔模拟交易(40笔正常 + 10笔协同欺诈)
2. **模式智能体**构建网络图并扫描刷单特征签名
3. **风险智能体**使用透明的多因子公式对每个被标记的簇进行评分
4. **告警智能体**生成Markdown审计报告并将检测到的团伙渲染为PNG图
全部代码控制在300行Python以内。所有内容均可复现。
## 如何运行
```
pip install -r requirements.txt
python generate_mock_data.py
python run_pipeline.py
```
输出:
- `output/audit_report.md` — 人类可读的审计报告
- `output/gang_graph.png` — 检测到的欺诈网络可视化
## 在模拟数据集上的示例输出
```
Loaded 50 transactions.
Built network graph with 203 nodes and 191 edges.
Detected 1 suspicious cluster(s).
Cluster on IP 192.168.10.42 → score 0.865 (HIGH)
Accounts: 10 (10 young)
Time window: 3.37 minutes
SKU: SKU-PREMWATCH-7829
Seller: SELLER-FRAUD-X
Total amount: $5043.95
```
系统正确识别了被植入的10账户团伙,并为其分配了**高风险**等级,建议立即进行人工审计复核。
## 检测逻辑(模式智能体)
图中包含四种节点类型和四种边类型:
| 节点 | 含义 |
|---|---|
| Account | 买家账户 |
| IP | IP地址 |
| Device | 设备指纹 |
| SKU | 购买的商品 |
| Seller | 接收收入的卖家 |
当一个簇满足以下条件时会被标记:
- **4个或更多账户**共享同一IP地址
- 所有账户购买**同一SKU**
- 时间窗口在**10分钟以内**
- **大多数账户注册时间不到7天**
此规则捕捉了核心协同刷单特征。在完整的AuditMind系统中,该基于规则的扫描将被一个在标记欺诈案例上训练的RGCN(关系图卷积网络)所替代。对于概念验证,透明规则更有用,因为每个被标记的案例都可以用一句话向审计员解释清楚。
## 评分逻辑(风险智能体)
分数是三个因子的加权和,每个因子归一化到[0, 1]:
```
score = 0.40 * time_factor (tighter burst = higher risk)
+ 0.30 * ip_factor (more accounts on one IP = higher risk)
+ 0.30 * age_factor (younger accounts = higher risk)
```
阈值:
| 分数 | 等级 | 动作 |
|---|---|---|
| > 0.80 | 高风险 | 需要人工审计复核 |
| 0.40 到 0.80 | 中风险 | 加入每日批量审核队列 |
| < 0.40 | 低风险 | 自动批准并保留审计轨迹 |
这是提案中提出的人机协同(HITL)模式。不会在不经过人工确认的情况下对账户采取任何操作。
## 这如何与完整的AuditMind提案衔接
此概念验证是楔入的一角。它所证明的部分包括:
- **数据摄取**:我可以加载、清洗并结构化交易数据(基于我现有的个人财务流水线)
- **模式识别**:我可以构建图并检测跨账户的协同模式
- **风险评估**:我可以将多个信号组合成一个可解释的单一分值
- **告警输出**:我可以生成审计级别、人类真正会使用的输出
- **HITL**:路由逻辑将需要人工介入的部分与不需要的部分分离
**不在本概念验证中的部分**,这些将在决赛阶段构建:
- 在真实标记数据上训练的RGCN模型(取代基于规则的扫描)
- 用于自然语言审计叙述的LLM集成(告警智能体)
- 三层记忆系统(工作记忆、情景记忆、语义记忆)并具备真实持久化
- 钉钉/Slack Webhook 推送
- 面向中国企业的本地部署方案
## 仓库结构
```
auditmind-poc/
├── README.md this file
├── requirements.txt pandas, networkx, matplotlib, numpy
├── generate_mock_data.py creates 50-row test dataset
├── pattern_agent.py graph construction + detection
├── risk_agent.py multi-factor scoring
├── alert_agent.py report generation + visualization
├── run_pipeline.py end-to-end runner
├── data/
│ └── transactions.csv generated dataset
└── output/
├── audit_report.md generated report
└── gang_graph.png generated network visualization
```
## 作者
**Aditi Malla**
中央密歇根大学,信息系统硕士
提交至2026年Deloitte Digital Elite Challenge,团队I(导师:Leo Ma)
- GitHub: [github.com/aditi-reddy](https://github.com/aditi-reddy)
- 基础项目:个人财务流水线 [personal-finance-pipeline](https://github.com/aditi-reddy/personal-finance-pipeline)
- LinkedIn: [linkedin.com/in/aditi-reddy-malla-275a70222](https://www.linkedin.com/in/aditi-reddy-malla-275a70222/)
## 许可证
本项目提交至Deloitte Digital Elite Challenge 2026。所有代码均为原创作品。
标签:DEMO, Pipeline, Proof of Concept, PyRIT, Python, 刷单检测, 可重现, 团队协作, 图网络, 多智能体系统, 审计思维, 审计报告, 异常检测, 挑战赛, 无后门, 模式识别, 欺诈检测, 电商反欺诈, 网络图分析, 逆向工具, 透明公式, 风险评分