supersleazy/Ethereum-Fraud-Detection

GitHub: supersleazy/Ethereum-Fraud-Detection

这是一个使用监督机器学习和行为分析来检测以太坊欺诈钱包的项目。

Stars: 0 | Forks: 0

# 基于监督机器学习的以太坊 (ETH) 欺诈检测 通过行为交易分析和监督机器学习检测欺诈性以太坊钱包。 ## 简介 本项目的目标是探索机器学习模型能否利用行为交易特征和 ERC20 活动模式来识别欺诈性以太坊钱包。 项目重点研究: - 以太坊钱包的行为分析 - 探索性数据分析 - 欺诈模式检测 - 基于机器学习的分类 ## 设置与运行 Jupyter Notebook: 1. 克隆仓库 git clone https://github.com/supersleazy/ethereum-fraud-detection.git 2. 进入项目文件夹 cd ethereum-fraud-detection 3. 安装所需库 pip install -r requirements.txt 4. 启动 Jupyter Notebook python -m notebook 5. 打开 Notebook 打开: notebooks/ethereum_fraud_detection.ipynb 然后按顺序运行各个单元。 ## 数据集 使用的数据集: - 以太坊欺诈检测数据集 (Kaggle) 该数据集包含约 9800 条以太坊钱包记录,并带有欺诈与非欺诈标签。 每一行代表一个钱包/账户,包含聚合的区块链统计数据,例如: - 交易数量 - 以太币转账金额 - ERC20 活动 - 钱包交互行为 - 交易时间特征 ## 数据分析 项目从探索性数据分析 (EDA) 开始,以更好地理解钱包行为和与欺诈相关的交易模式。 分析包括: - 正常钱包与欺诈钱包的分布 - 交易数量分布 - 偏斜的区块链活动可视化 - 特征相关性分析 - ERC20 行为分析 - 用于正常与欺诈钱包比较的小提琴图和箱线图 ## 机器学习工作流程 1. 数据加载与清洗 2. 探索性数据分析 3. 钱包活动的行为分析 4. 与欺诈标签的相关性分析 5. 数据预处理与特征缩放 6. 训练-测试集划分 7. 模型训练 8. 模型评估 9. 特征重要性分析 ## 机器学习模型 训练并评估了以下监督机器学习模型: ### 逻辑回归 用作欺诈分类的基准模型。 ### 随机森林 用于捕捉以太坊钱包特征之间的非线性行为关系。 ### XGBoost 用作最终的提升模型。 ## 模型评估 模型评估指标包括: - 准确率 - 精确率 - 召回率 - F1 分数 - ROC-AUC | 模型 | 准确率 | 精确率 | **召回率** | F1 分数 | ROC-AUC | | :--- | :--- | :--- | :--- | :--- | :--- | | 逻辑回归 | 0.9334 | 0.8657 | **0.8279** | 0.8464 | 0.9405 | | 随机森林 | 0.9903 | 1.0000 | **0.9564** | 0.9777 | 0.9992 | | XGBoost | 0.9964 | 1.0000 | **0.9839** | 0.9919 | 0.9986 | # 使用技术 Python | Pandas | NumPy | Matplotlib | Seaborn | Scikit-learn | XGBoost | Jupyter Notebook # 仓库结构 ``` Ethereum-Fraud-Detection/ │ ├── data/ │ └──transaction_dataset.csv │ └──transaction_dataset.zip ├── notebooks/ │ └── ethereum_fraud_detection.ipynb │ ├── reports/ │ └── Report_PDF.pdf │ └── Report_HTML.html │ ├── requirements.txt │ └── README.md ``` # 未来改进 项目可能的未来扩展方向: - 5 折交叉验证 - 集成堆叠与装袋 - 外部数据集验证 - 额外的区块链行为特征 # 结论 本项目探索了使用行为交易分析和机器学习进行以太坊钱包欺诈检测。 项目证明: - 欺诈性钱包表现出明显不同的行为模式 - ERC20 活动包含重要的欺诈相关信号 - 集成模型对于区块链欺诈检测任务非常有效 该工作流程也展示了结合以下方法的重要性: - 探索性数据分析 - 行为解释 - 机器学习 - 特征重要性分析 以更好地理解区块链网络上的欺诈行为。
标签:Apex, ERC20代币, Logistic Regression, NoSQL, Python, XGBoost, 交易分析, 代码示例, 以太坊, 分类模型, 区块链, 后端开发, 探索性数据分析, 数据分析, 数据预处理, 无后门, 机器学习, 模型训练, 模式识别, 欺诈检测, 特征工程, 监督学习, 网络安全, 逆向工具, 金融科技, 钱包分析, 随机森林, 隐私保护