Core-ByteLord/Fraud-Detection-Handbook
GitHub: Core-ByteLord/Fraud-Detection-Handbook
一本关于信用卡欺诈检测的可复现机器学习实用手册,提供特征工程、模型选择和不平衡学习等技术指南。
Stars: 10 | Forks: 0
# 可复现的信用卡欺诈检测机器学习 - 实用手册
## 早期访问
初步版本可在 [https://fraud-detection-handbook.github.io/fraud-detection-handbook/Foreword.html](https://fraud-detection-handbook.github.io/fraud-detection-handbook/Foreword.html) 获取。
## 动机
信用卡欺诈检测机器学习(ML for CCFD)已成为一个活跃的研究领域。这可以从[过去十年间该主题的大量出版物](https://fraud-detection-handbook.github.io/fraud-detection-handbook/Chapter_2_Background/MachineLearningForFraudDetection.html)得到说明。
毫无疑问,机器学习技术与支付卡欺诈检测系统的集成大大提高了其更高效检测欺诈的能力。同时,这个新研究领域的一个主要问题是缺乏可复现性。目前不存在任何公认的基准或方法来比较和评估所提出的技术。
本书旨在朝这个方向迈出第一步。本书提供的所有技术和结果都是可复现的。包含代码的部分采用 Jupyter 笔记本形式,可以在本地执行,也可以使用 [Google Colab](https://colab.research.google.com/) 或 [Binder](https://mybinder.org/) 在云端执行。
本书的目标读者是对从实际角度解决信用卡欺诈检测这一特定问题感兴趣的学生或专业人士。更一般地,我们认为本书对于处理涉及序列数据和/或不平衡分类问题的机器学习问题的数据实践者和数据科学家也很有价值。
暂定目录:
* 第一章:本书概述
* 第二章:背景知识
* 第三章:入门指南
* 第四章:性能指标
* 第五章:模型选择
* 第六章:不平衡学习
* 第七章:深度学习
* 第八章:可解释性*
(*):尚未发布。
## 当前草稿
本书的撰写工作正在进行中。我们通过这个 GitHub 仓库提供本书的早期访问。截至 2022 年 1 月,前七章已发布。
本书当前草稿的在线版本可在[此处](https://fraud-detection-handbook.github.io/fraud-detection-handbook/)获取。
欢迎任何评论或建议。我们建议使用 GitHub issues 来开始讨论某个主题,并使用 pull requests 来修复拼写错误。
## 编译本书
为了在您的计算机上阅读和/或执行本书,您需要克隆此仓库并编译本书。
本书是一本 Jupyter Book。因此,您首先需要[安装 Jupyter Book](https://jupyterbook.org/intro.html#install-jupyter-book)。
编译已通过以下软件包版本进行测试:
```
sphinxcontrib-bibtex==2.2.1
Sphinx==4.2.0
jupyter-book==0.11.2
```
完成后,需要两个步骤:
1. 克隆此仓库:
```
git clone https://github.com/Fraud-Detection-Handbook/fraud-detection-handbook
```
2. 编译本书
```
jupyter-book build fraud-detection-handbook
```
本书将在本地 `fraud-detection-handbook/_build/html/index.html` 提供。
## 许可证
笔记本中的代码采用 [GNU GPL v3.0 许可证](https://www.gnu.org/licenses/gpl-3.0.en.html) 发布。文字和图片采用 [CC BY-SA 4.0 许可证](https://creativecommons.org/licenses/by-sa/4.0/) 发布。
如果您想引用本书,可以使用以下内容:
@book{leborgne2022fraud,
title={Reproducible Machine Learning for Credit Card Fraud Detection - Practical Handbook},
author={Le Borgne, Yann-A{\"e}l and Siblini, Wissam and Lebichot, Bertrand and Bontempi, Gianluca},
url={https://github.com/Fraud-Detection-Handbook/fraud-detection-handbook},
year={2022},
publisher={Universit{\'e} Libre de Bruxelles}
}
## 作者
* [Yann-Aël Le Borgne](https://yannael.github.io/)(联系人 - yann-ael.le.borgne@ulb.be) - [Machine Learning Group - Université Libre de Bruxelles, Belgium](http://mlg.ulb.ac.be)。
* [Wissam Siblini](https://www.linkedin.com/in/wissam-siblini) - [Machine Learning Research - Worldline Labs](https://worldline.com)
* [Bertrand Lebichot](https://b-lebichot.github.io/) - [Interdisciplinary Centre for Security, Reliability and Trust - Université du Luxembourg, Luxembourg](https://wwwfr.uni.lu/snt)
* [Gianluca Bontempi](https://mlg.ulb.ac.be/wordpress/members-2/gianluca-bontempi/) - [Machine Learning Group - Université Libre de Bruxelles, Belgium](http://mlg.ulb.ac.be)标签:Apex, Jupyter, Python, 不平衡分类, 二分类问题, 信用卡欺诈, 信用评分, 凭据扫描, 可解释性, 异常检测, 性能指标, 支付安全, 数据科学, 无后门, 机器学习, 模型评估, 模型选择, 欺诈检测, 深度学习, 特征工程, 资源验证, 逆向工具, 重采样技术, 金融科技, 顺序数据