tbanjo1/Credit-Card-Fraud-Detection
GitHub: tbanjo1/Credit-Card-Fraud-Detection
使用多种机器学习分类模型在高度不平衡的信用卡交易数据集上检测欺诈交易,并通过多维度评估指标比较模型性能。
Stars: 0 | Forks: 0
# 使用机器学习进行信用卡欺诈检测
## 概述
本项目构建了一个机器学习模型来检测欺诈性的信用卡交易。目标是通过分类算法和侧重于检测性能的评估指标,在高度不平衡的数据集中识别欺诈活动。
## 问题陈述
信用卡欺诈虽然罕见,但代价高昂。由于类别不平衡,传统的准确率不足以用于评估,因此本项目侧重于使用精确率、召回率和 ROC-AUC 来改进欺诈检测。
## 数据集
所使用的数据集包含匿名化的信用卡交易记录,并标记为欺诈或合法。
## 项目工作流
### 1. 数据预处理
- 处理缺失值(如果有)
- 缩放数值特征
- 处理类别不平衡问题
### 2. 探索性数据分析 (EDA)
- 欺诈与非欺诈交易的分布
- 相关性分析
- 特征洞察
### 3. 特征工程
- 数据归一化
- 特征选择技术
### 4. 模型构建
实现了以下机器学习模型:
- Logistic Regression
- Decision Tree Classifier
- Random Forest Classifier
- Support Vector Machine (SVM)
### 5. 模型评估
使用以下指标对模型进行评估:
- Accuracy
- Precision
- Recall
- F1-Score
- ROC-AUC Score
- 混淆矩阵
## 结果
对各个模型进行了比较,以确定用于欺诈检测的最佳性能方法。重点放在最大化召回率上,以减少假阴性(漏报的欺诈案例)。
## 技术栈
- Python
- Pandas
- NumPy
- Scikit-learn
- Matplotlib
- Jupyter Notebook
## 关键要点
- 对于不平衡数据集,仅凭准确率是不够的
- 集成方法通常在欺诈检测中表现更好
- 特征缩放和预处理对性能有显著影响
## 展现的技能
- 机器学习
- 数据预处理
- 分类建模
- 不平衡数据集处理
- 模型评估
- 数据可视化
## 作者
Oluwatobi Banjo
## 许可证
本项目仅用于教育和作品集展示目的。
标签:Apex, NoSQL, Python, Scikit-learn, 分类模型, 数据科学, 无后门, 机器学习, 欺诈检测, 资源验证, 逆向工具, 金融风控