erhridoybiswas/Credit-Card-Fraud-Detection

GitHub: erhridoybiswas/Credit-Card-Fraud-Detection

一个端到端的信用卡欺诈检测机器学习项目,包含多模型训练 Pipeline 和 Flask 实时预测仪表盘,用于识别可疑交易并降低误报率。

Stars: 0 | Forks: 0

# 💳 信用卡欺诈检测 一个用于检测欺诈性信用卡交易的完整机器学习项目,包含可训练的模型 pipeline 和实时 Web 仪表盘。 ## 📌 问题陈述 每年因信用卡欺诈造成的损失高达数十亿。银行需要能够以高准确率标记可疑交易,同时将误报率降至最低的自动化系统。 ## ✅ 解决方案 - 在高度不平衡的数据集上训练了多个分类器(Logistic Regression、Random Forest、XGBoost)。 - 应用 **SMOTE** 处理类别不平衡问题。 - 使用 **Precision、Recall、F1-score、ROC-AUC、PR-AUC** 进行评估。 - 将最佳模型(XGBoost)部署到带有交互式 HTML/CSS 仪表盘的 **Flask Web 应用** 中。 - 用户可以输入交易明细,并即时获取欺诈概率和警报。 ## 🛠 技术栈 - **语言与工具**:Python 3.8+、Pandas、NumPy、Scikit-learn、Imbalanced-learn、XGBoost、Flask、HTML5、CSS3 - **可视化**:Matplotlib、Seaborn - **部署**:通过 Flask 在 Localhost 运行 ## 📂 项目结构 - `data/` – 原始数据集(从 Kaggle 下载) - `notebooks/` – 探索性数据分析 - `src/` – 预处理、训练、工具函数 - `models/` – 保存的模型和 Scaler - `app/` – Flask 应用,包含模板和静态文件 - `outputs/` – 评估图表 - `main.py` – 用于训练或运行应用的入口文件 ## 🚀 如何运行 1. 克隆仓库并安装依赖。 2. 将 `creditcard.csv` 放入 `data/` 目录中。 3. 训练模型:`python main.py --train` 4. 启动仪表盘:`python main.py --app` 5. 打开 `http://127.0.0.1:5000` ## 📊 结果 - **最佳模型**:XGBoost,PR-AUC 达到 **0.85**(示例) - 高召回率确保了大多数欺诈案件都能被捕获。 - 请查看 `outputs/` 目录以获取混淆矩阵和精确率-召回率曲线。
标签:Apex, Flask, PR-AUC, Python, ROC-AUC, Scikit-learn, SMOTE, Web应用开发, XGBoost, 交互式仪表盘, 信用卡欺诈检测, 分类模型, 反欺诈, 实时预测系统, 异常检测, 数据工程, 数据科学, 数据科学作品集, 数据预处理, 无后门, 机器学习, 模型评估, 类别不平衡, 资源验证, 逆向工具, 逻辑回归, 金融风控, 随机森林