Maestro2281488/Anti-Fraud-Detection-Feature-Engineering-Model-Ensemble-XGBoost-CatBoost-
GitHub: Maestro2281488/Anti-Fraud-Detection-Feature-Engineering-Model-Ensemble-XGBoost-CatBoost-
一套端到端的反欺诈特征工程与模型集成方案,旨在以 XGBoost 与 CatBoost 提升对可疑交易的识别精度。
Stars: 0 | Forks: 0
# 反欺诈特征工程模型集成 XGBoost CatBoost
Цей блокнот містить повний цикл розробки моделі машинного навчання для ідентифікації підозрілих операцій у реальному часі. Основна мета — мінімізація збитків від шахрайства при збереженні високої якості обслуговування легітимних користувачів.
Ключові етапи роботи:
Глибокий аналіз даних (EDA): Дослідження дисбалансу класів та кореляцій між ознаками.
Feature Engineering: Створення нових ознак на основі поведінкових патернів користувачів та використання методу Feature Crosses для виявлення прихованих залежностей.
Підготовка даних: Очищення від аномалій та обробка категоріальних змінних.
Моделювання: Навчання та тюнінг градієнтного бустингу з використанням бібліотек XGBoost та CatBoost.
Оптимізація метрик: Оскільки дані мають сильний дисбаланс, основний фокус було зроблено на максимізації F1-score та аналізі кривої Precision-Recall, щоб знайти оптимальний поріг класифікації.
Результати:
Модель демонструє високу здатність розрізняти шахрайські схеми, що підтверджено метриками на відкладеній вибірці.
标签:Apex, CatBoost, F1-score, XGBoost, 业务风控, 分布式计算, 反欺诈检测, 实时检测, 异常处理, 数据清洗, 机器学习, 梯度提升, 模型调优, 模型集成, 特征交叉, 特征工程, 用户行为分析, 类别不平衡, 精准率-召回率曲线, 逆向工具