jiamingzhu-user/shortcut-resistant-encrypted-traffic-classification
GitHub: jiamingzhu-user/shortcut-resistant-encrypted-traffic-classification
提出抗捷径加密流量分类方法,解决多视图特征选择与少数类增强问题。
Stars: 0 | Forks: 0
# 抗捷径多视图特征选择与语义增强的加密流量分类
论文代码:
**Shortcut-Resistant Multi-view Feature Selection and Semantic Augmentation for Encrypted Traffic Classification**
本仓库包含抗捷径加密流量分类的核心流程。简而言之,它涵盖:
- 从流量痕迹中提取旁路特征
- 使用 `MUMFS` 进行多视图特征选择
- 使用 `TAGAN-F` 进行少数类增强
- 采用分层决策模块进行风险感知推理
当前版本以 ISCX 作为特征提取和流程执行的运行示例,其他数据集遵循相同的提取和预处理逻辑。
## 主要组件
- `mumfs.py`:基于 MUMFS 的多视图特征评分与自适应特征选择。
- `tagan_f.py`:TAGAN-F,一种用于少数类增强的语义感知表格 GAN。
- `layer_decision.py`:基于阈值路由和质心辅助专家选择的分层决策模块。
## 文件
- `core_utils.py`:用于种子设置、计时、标准化和 XGBoost 训练的工具。
- `datasets.py`:ISCX CSV 加载、切分处理、视图构建与特征导出辅助工具。
- `extract_iscx_ultimate.py`:ISCX-VPN 设置的 PCAP 到 CSV 特征提取脚本。
- `run_iscx_pipeline.py`:公共流程的端到端训练与评估入口。
- `mumfs.py`:多视图图构建、稀疏哈希评分器与自适应选择器。
- `tagan_f.py`:带语义、相关性与特征匹配约束的条件 WGAN-GP 风格生成器。
- `layer_decision.py`:每类阈值校准、不确定性路由与基于质心的门控。
## 数据集
- 论文中的实验基于公开数据集,包括 [ISCXVPN2016](https://www.unb.ca/cic/datasets/vpn.html)、[USTC-TFC2016](https://github.com/davidyslu/USTC-TFC2016)、[CSTNET-TLS 1.3](https://github.com/linwhitehat/ET-BERT) 和 [CipherSpectrum](https://cgi.cse.unsw.edu.au/~cspectrum/)。
- ISCX 提取器在此作为具体示例提供。其他数据集使用的提取逻辑遵循相同的捷径减少、旁路导向特征构造的整体设计原则。
标签:CSTNET-TLS 1.3, CSV特征导出, ISCX VPN 2016, MUMFS, PCAP特征提取, Python, SSL/TLS 加密流量, TAGAN-F, USTC-TFC2016, XGBoost训练, 不确定性路由, 侧信道特征提取, 分层决策模块, 加密流量分类, 多视图特征选择, 少数类增强, 快捷方式抗性, 数据分割, 无后门, 时间戳, 机器学习分类, 条件WGAN-GP, 标准化, 流量侧信道分析, 深度学习, 特征匹配约束, 生成对抗网络, 相关约束, 稀疏哈希评分器, 网络安全, 自适应选择器, 语义感知, 质心门控, 逆向工具, 阈值校准, 隐私保护