rediet-shewarega/fraud-detection-proj
GitHub: rediet-shewarega/fraud-detection-proj
一个针对电商与信用卡交易的欺诈检测数据预处理与特征工程项目,通过数据清洗、探索性分析和特征工程为机器学习模型准备高质量数据集。
Stars: 0 | Forks: 0
# 欺诈检测项目
## 项目概述
本项目专注于电子商务和银行信用卡交易的欺诈检测。目标是准备干净、特征丰富的数据集,并随后构建能够识别欺诈交易的机器学习模型。
## 业务问题
欺诈检测非常重要,因为误报会影响客户信任,而漏报则会导致经济损失。本项目旨在通过数据分析、特征工程和机器学习来平衡这些风险。
## 数据集
本项目使用了三个数据集:
1. `Fraud_Data.csv` — 电子商务交易数据。
2. `IpAddress_to_Country.csv` — IP 地址到国家的映射。
3. `creditcard.csv` — 匿名化的银行信用卡交易数据。
## 阶段一进展
在阶段一中,完成了以下任务:
- 数据清洗
- 缺失值检查
- 去除重复项
- 数据类型修正
- 探索性数据分析
- 类别不平衡分析
- IP 地址到国家的映射
- 基于时间的特征工程
- 交易频率特征工程
- 数据转换准备
- SMOTE 策略说明
## 项目结构
```
fraud-detection/
├── data/
│ ├── raw/
│ └── processed/
├── notebooks/
│ ├── eda-fraud-data.ipynb
│ ├── eda-creditcard.ipynb
│ └── feature-engineering.ipynb
├── src/
├── tests/
├── models/
├── scripts/
├── requirements.txt
├── README.md
└── .gitignore
```
标签:Apex, NoSQL, 代码示例, 数据分析, 数据清洗, 机器学习, 欺诈检测, 特征工程, 逆向工具, 金融风控