rediet-shewarega/fraud-detection-proj

GitHub: rediet-shewarega/fraud-detection-proj

一个针对电商与信用卡交易的欺诈检测数据预处理与特征工程项目,通过数据清洗、探索性分析和特征工程为机器学习模型准备高质量数据集。

Stars: 0 | Forks: 0

# 欺诈检测项目 ## 项目概述 本项目专注于电子商务和银行信用卡交易的欺诈检测。目标是准备干净、特征丰富的数据集,并随后构建能够识别欺诈交易的机器学习模型。 ## 业务问题 欺诈检测非常重要,因为误报会影响客户信任,而漏报则会导致经济损失。本项目旨在通过数据分析、特征工程和机器学习来平衡这些风险。 ## 数据集 本项目使用了三个数据集: 1. `Fraud_Data.csv` — 电子商务交易数据。 2. `IpAddress_to_Country.csv` — IP 地址到国家的映射。 3. `creditcard.csv` — 匿名化的银行信用卡交易数据。 ## 阶段一进展 在阶段一中,完成了以下任务: - 数据清洗 - 缺失值检查 - 去除重复项 - 数据类型修正 - 探索性数据分析 - 类别不平衡分析 - IP 地址到国家的映射 - 基于时间的特征工程 - 交易频率特征工程 - 数据转换准备 - SMOTE 策略说明 ## 项目结构 ``` fraud-detection/ ├── data/ │ ├── raw/ │ └── processed/ ├── notebooks/ │ ├── eda-fraud-data.ipynb │ ├── eda-creditcard.ipynb │ └── feature-engineering.ipynb ├── src/ ├── tests/ ├── models/ ├── scripts/ ├── requirements.txt ├── README.md └── .gitignore ```
标签:Apex, NoSQL, 代码示例, 数据分析, 数据清洗, 机器学习, 欺诈检测, 特征工程, 逆向工具, 金融风控