erhridoybiswas/Credit-Card-Fraud-Detection

GitHub: erhridoybiswas/Credit-Card-Fraud-Detection

一个端到端的信用卡欺诈检测机器学习项目，包含多模型训练 Pipeline 和 Flask 实时预测仪表盘，用于识别可疑交易并降低误报率。

Stars: 0 | Forks: 0

# 💳 信用卡欺诈检测一个用于检测欺诈性信用卡交易的完整机器学习项目，包含可训练的模型 pipeline 和实时 Web 仪表盘。 ## 📌 问题陈述每年因信用卡欺诈造成的损失高达数十亿。银行需要能够以高准确率标记可疑交易，同时将误报率降至最低的自动化系统。 ## ✅ 解决方案 - 在高度不平衡的数据集上训练了多个分类器（Logistic Regression、Random Forest、XGBoost）。 - 应用 **SMOTE** 处理类别不平衡问题。 - 使用 **Precision、Recall、F1-score、ROC-AUC、PR-AUC** 进行评估。 - 将最佳模型（XGBoost）部署到带有交互式 HTML/CSS 仪表盘的 **Flask Web 应用** 中。 - 用户可以输入交易明细，并即时获取欺诈概率和警报。 ## 🛠 技术栈 - **语言与工具**：Python 3.8+、Pandas、NumPy、Scikit-learn、Imbalanced-learn、XGBoost、Flask、HTML5、CSS3 - **可视化**：Matplotlib、Seaborn - **部署**：通过 Flask 在 Localhost 运行 ## 📂 项目结构 - `data/` – 原始数据集（从 Kaggle 下载） - `notebooks/` – 探索性数据分析 - `src/` – 预处理、训练、工具函数 - `models/` – 保存的模型和 Scaler - `app/` – Flask 应用，包含模板和静态文件 - `outputs/` – 评估图表 - `main.py` – 用于训练或运行应用的入口文件 ## 🚀 如何运行 1. 克隆仓库并安装依赖。 2. 将 `creditcard.csv` 放入 `data/` 目录中。 3. 训练模型：`python main.py --train` 4. 启动仪表盘：`python main.py --app` 5. 打开 `http://127.0.0.1:5000` ## 📊 结果 - **最佳模型**：XGBoost，PR-AUC 达到 **0.85**（示例） - 高召回率确保了大多数欺诈案件都能被捕获。 - 请查看 `outputs/` 目录以获取混淆矩阵和精确率-召回率曲线。

标签：Apex, Flask, PR-AUC, Python, ROC-AUC, Scikit-learn, SMOTE, Web应用开发, XGBoost, 交互式仪表盘, 信用卡欺诈检测, 分类模型, 反欺诈, 实时预测系统, 异常检测, 数据工程, 数据科学, 数据科学作品集, 数据预处理, 无后门, 机器学习, 模型评估, 类别不平衡, 资源验证, 逆向工具, 逻辑回归, 金融风控, 随机森林