SRINIVASTA/forensic-aml-risk-pipeline
GitHub: SRINIVASTA/forensic-aml-risk-pipeline
基于Streamlit和Python构建的自动化KYC/AML合规分析套件,通过Isolation Forest异常检测和制裁名单筛查实时或批量识别金融交易中的洗钱风险。
Stars: 0 | Forks: 0
# 🛡️ 取证 KYC/AML 合规套件
一个基于 **Streamlit** 和 **Python 3.14** 构建的高密度、自动化金融情报监控引擎。该套件提供跨传入实时现金流和静态客户注册表的多向量合规分析,以瞬间隔离洗钱、制裁规避和政治暴露风险。
## 📈 架构与系统拓扑
该软件被解耦为一个显式的四向功能模块化 pipeline 框架:
```
├── app.py # Core UI State Machine & Modality Orchestrator
├── requirements.txt
└── engines/
├── __init__.py # Empty structural package marker
├── kyc_engine.py # Fuzzy String Matchers & Onboarding Risk Core
├── aml_engine.py # Isolation Forest ML Engine & Country Corridors
└── reporting_engine.py # High-Performance In-Memory PDF & Excel Serializer
```
### 🧱 组件矩阵分解
#### 1. `app.py`
系统编排器。它管理用户设置,处理文件上传,驱动渲染 container 目标,并绑定流式 ticker。它具有持久的浏览器会话跟踪功能(`st.session_state`),以确保在切换报告操作开关时,您的执行日志和分析可视化阵列绝不会从内存中丢失。
#### 2. `kyc_engine.py`
驱动单个实体验证检查。它利用高度优化且空间高效的 2 行滚动 **Levenshtein 距离比率** 算法,针对政治暴露人物(PEP)矩阵执行模糊名称筛查,如果字符串长度偏差违反剪枝标准,则会短路查找计算。
#### 3. `aml_engine.py`
评估算法交易流模式。它将金融数量传递到配置为在优化的 1% 边界分离异常的 **Isolation Forest 机器学习异常分类器**。同时,它评估高危离岸通道(`KY`、`BM`、`CY` 等)并处理原始数据列对齐。
#### 4. `reporting_engine.py`
核心文档工厂。它按需生成全面的合规档案。它使用 `fpdf2` 和 `openpyxl` 将格式化的账本数据帧直接通过管道输送到内存中的二进制流缓冲区(`io.BytesIO`)。这避免了文件系统的介入,修复了 Python 3.14 下的协议错误和布局丢失问题。
## ⚡ 部署与快速入门
### 📥 1. 克隆与结构对齐
确保您的代码布局与下方的 package 框架完全一致:
```
git clone https://github.com
cd forensic-aml-risk-pipeline
```
### 📦 2. 配置本地环境变量
在应用程序的主根目录中创建一个 `requirements.txt` 文件:
```
streamlit
pandas
numpy
scikit-learn
fpdf2
openpyxl
matplotlib
```
通过您首选的终端 shell 安装所需的依赖项:
```
pip install -r requirements.txt
```
### 🚀 3. 启动应用程序
使用以下执行调用启动本地验证服务器实例:
```
streamlit run app.py
```
## 🛠️ 模态操作工作流
* **⚡ 实时数据流**:模拟直接的全球 SWIFT/ACH 交易传输。如果数据流中断或跳帧,请使用自定义侧边栏的 **重置实时模拟历史** 按钮清除会话缓存注册表并清空指标阵列,以便进行全新测试。
* **📄 静态 CSV 上传**:接受完整的批处理文件(`clients.csv` 和 `transactions.csv`)。它动态映射列别名,显示风险类别分布图表,并即时导出分离的高风险案例工作表。
## 🛡️ 数据合规标准矩阵
* **OFAC / FATF 制裁**:用于标记高危司法管辖区的即时匹配过滤器。
* **通道路由风险**:用于追踪从标准主权实体流向已知离岸资产避税天堂的资金的隔离过滤器。
* **认知异常树**:通过无监督 Isolation Forest 模型处理来阻止结构性的拆分速度飙升。
## ✒️ 作者与知识产权
由 **Srinivasta** 创建并维护。保留所有权利。
标签:AML, Kubernetes, KYC, Streamlit, 异常检测, 访问控制, 逆向工具, 金融科技