erhridoybiswas/Credit-Card-Fraud-Detection
GitHub: erhridoybiswas/Credit-Card-Fraud-Detection
一个端到端的信用卡欺诈检测机器学习项目,包含多模型训练 Pipeline 和 Flask 实时预测仪表盘,用于识别可疑交易并降低误报率。
Stars: 0 | Forks: 0
# 💳 信用卡欺诈检测
一个用于检测欺诈性信用卡交易的完整机器学习项目,包含可训练的模型 pipeline 和实时 Web 仪表盘。
## 📌 问题陈述
每年因信用卡欺诈造成的损失高达数十亿。银行需要能够以高准确率标记可疑交易,同时将误报率降至最低的自动化系统。
## ✅ 解决方案
- 在高度不平衡的数据集上训练了多个分类器(Logistic Regression、Random Forest、XGBoost)。
- 应用 **SMOTE** 处理类别不平衡问题。
- 使用 **Precision、Recall、F1-score、ROC-AUC、PR-AUC** 进行评估。
- 将最佳模型(XGBoost)部署到带有交互式 HTML/CSS 仪表盘的 **Flask Web 应用** 中。
- 用户可以输入交易明细,并即时获取欺诈概率和警报。
## 🛠 技术栈
- **语言与工具**:Python 3.8+、Pandas、NumPy、Scikit-learn、Imbalanced-learn、XGBoost、Flask、HTML5、CSS3
- **可视化**:Matplotlib、Seaborn
- **部署**:通过 Flask 在 Localhost 运行
## 📂 项目结构
- `data/` – 原始数据集(从 Kaggle 下载)
- `notebooks/` – 探索性数据分析
- `src/` – 预处理、训练、工具函数
- `models/` – 保存的模型和 Scaler
- `app/` – Flask 应用,包含模板和静态文件
- `outputs/` – 评估图表
- `main.py` – 用于训练或运行应用的入口文件
## 🚀 如何运行
1. 克隆仓库并安装依赖。
2. 将 `creditcard.csv` 放入 `data/` 目录中。
3. 训练模型:`python main.py --train`
4. 启动仪表盘:`python main.py --app`
5. 打开 `http://127.0.0.1:5000`
## 📊 结果
- **最佳模型**:XGBoost,PR-AUC 达到 **0.85**(示例)
- 高召回率确保了大多数欺诈案件都能被捕获。
- 请查看 `outputs/` 目录以获取混淆矩阵和精确率-召回率曲线。
标签:Apex, Flask, PR-AUC, Python, ROC-AUC, Scikit-learn, SMOTE, Web应用开发, XGBoost, 交互式仪表盘, 信用卡欺诈检测, 分类模型, 反欺诈, 实时预测系统, 异常检测, 数据工程, 数据科学, 数据科学作品集, 数据预处理, 无后门, 机器学习, 模型评估, 类别不平衡, 资源验证, 逆向工具, 逻辑回归, 金融风控, 随机森林