shivam224145-creator/Healthcare-Fraud-Detection-EDA---ML
GitHub: shivam224145-creator/Healthcare-Fraud-Detection-EDA---ML
一个使用机器学习分析保险索赔数据以识别欺诈的端到端医疗欺诈检测项目。
Stars: 0 | Forks: 0
# Healthcare-Fraud-Detection-EDA-->ML
医疗保健欺诈检测项目,使用机器学习处理保险索赔数据。包含探索性数据分析(EDA)、数据预处理、特征工程和分类模型,用于识别欺诈性索赔。处理数据不平衡问题,并分析关键欺诈指标,如索赔金额、提供者行为和提交模式。
# 🏥 医疗保健欺诈检测
## 📌 项目概述
本项目专注于使用机器学习技术检测医疗保健保险欺诈。欺诈检测对于减少财务损失和提升系统效率至关重要。
## 📊 数据集
- 10,000 条医疗保健保险索赔
- 包含患者、提供者、财务和时间特征
- 目标变量:`Is_Fraud`(0 = 合法,1 = 欺诈)
- 数据集不平衡(~8% 为欺诈案例)
## ⚙️ 使用的特征
- 索赔金额与批准金额
- 保险类型
- 提供者专长
- 患者人口统计信息
- 索赔提交详情
- 就诊类型与住院时长
## 🔍 探索性数据分析(EDA)
- 欺诈与非欺诈分布
- 索赔金额模式
- 按提供者分析
- 缺失值分析
## 🛠️ 数据预处理
- 处理缺失值
- 编码分类变量
- 特征变换
## 🤖 机器学习模型
- 逻辑回归
- 决策树
- 随机森林
- XGBoost
## 📈 评估指标
- 精确率
- 召回率
- F1 分数
- 混淆矩阵
## 🔑 关键洞察
- 高索赔金额更可能为欺诈
- 快速提交索赔显示可疑行为
- 某些提供者具有更高的欺诈率
## 🚀 技术栈
- Python
- Pandas、NumPy
- Scikit-learn
- Matplotlib、Seaborn
## 📌 结论
该模型有助于识别潜在的欺诈性索赔,并可为保险公司改进欺诈检测系统、减少财务损失提供支持。
标签:Apex, EDA, F1分数, Matplotlib, NumPy, Python, Scikit-learn, Seaborn, XGBoost, 不平衡数据处理, 保险索赔, 健康保险, 决策树, 分类模型, 医疗保健, 医疗欺诈, 召回率, 后端开发, 提交模式, 提供者行为, 数据清洗, 数据预处理, 无后门, 机器学习, 欺诈检测, 混淆矩阵, 特征工程, 特征转换, 精确率, 索赔金额, 逆向工具, 逻辑回归, 金融风控, 随机森林