ThisPlatypus/The-intrinsic-convenience-of-FD

GitHub: ThisPlatypus/The-intrinsic-convenience-of-FD

该项目通过联邦学习与知识蒸馏方法，在隐私和通信约束下实现跨异构物联网设备的恶意软件检测。

Stars: 1 | Forks: 0

# 联邦学习在物联网恶意软件检测中的内在优势 ## 概述本仓库探讨了跨异构设备进行恶意软件检测的机器学习方法。其动机是在分布式和边缘环境中典型的隐私和通信约束条件下，提高检测准确性。 ## 研究背景与 IoT、网络安全、边缘 AI 和通信约束的关系： - IoT：许多资源受限的终端节点生成质量和分布各异的遥测数据。 - 网络安全：侧重于在保护数据隐私的同时，检测恶意行为和痕迹。 - 边缘 AI：在靠近数据源的地方进行训练和推理，以降低延迟和带宽使用。 - 通信约束：最小化模型/数据传输的方法，包括蒸馏和联邦式聚合。 ## 方法论模型、数据和评估方法： - 基线：经典的 ML 基线（例如，`Baseline/SVM.ipynb`、`Baseline/NAive_B.ipynb`）。 - 表示学习：基于 Autoencoder 的异常建模（`Autoencoder/AE_main.py`）。 - 知识蒸馏 / 聚合：基于蒸馏的训练以及客户端/服务端协同（`Distillation/main.py`、`Distillation/client.py`、`Distillation/server.py`）。 - 不平衡采样：用于处理类别不平衡的工具（`*/torchsampler`）。 - 评估：AUROC 和召回率；图表和指标保存在 `PLOT/` 和 `results/` 下。 ## 系统架构（可选，但对于系统类工作推荐填写）： - 客户端：`Autoencoder/client.py`、`Distillation/client.py` 用于在本地数据划分上训练模型。 - 服务端：`Autoencoder/server.py`、`Distillation/server.py` 用于协调聚合/蒸馏。 - 工具：`Autoencoder/utilities.py` 和 `Distillation/utilities.py` 中的共享辅助程序。 - 数据准备：`Util/` 下的脚本（例如，`Clean_Data_script.R`）。 ## 结果实验或发现摘要： - 汇总的指标和检查点保存在 `results/` 中（例如，包含全局损失和召回率的文件）。 - 可视化和相关性分析位于 `PLOT/` 中。 - 文本日志和运行记录可在 `runs_prove_txt/` 中找到。 ## 局限性明确的约束和假设： - 数据可用性和具体的预处理步骤可能有所不同；请确保与脚本保持一致。 - 可重复性取决于随机种子、数据划分和环境版本。 - 通信和系统约束可能是模拟的，而不是在真实网络中测量的。 - 硬件资源限制（例如，IoT 级设备）是近似值。 ## 参考文献 - Camerota, Chiara; Pecorella, Tommaso; Bagdanov, Andrew D. (2024). "The intrinsic convenience of federated learning in malware IoT detection." 2024 20th International Conference on Network and Service Management (CNSM), pp. 1–7. IEEE. [IEEE 摘要](https://ieeexplore.ieee.org/abstract/document/10814605/) • [PDF](https://flore.unifi.it/bitstream/2158/1406137/1/The_intrinsic_convenience_of_federated_learning_in_malware_IoT_detection.pdf)

标签：Apex, 凭据扫描, 机器学习, 物联网, 知识蒸馏, 联邦学习, 边缘AI, 逆向工具