Zeetay1/Synthetic-Data-Generator-with-Privacy-Guarantees
GitHub: Zeetay1/Synthetic-Data-Generator-with-Privacy-Guarantees
基于 CTGAN 的表格数据合成生成器,支持保真度、实用性和隐私性多维评估,并提供交互式仪表板探索隐私-效用权衡。
Stars: 0 | Forks: 0
# 具备隐私保障的合成数据生成器
使用 CTGAN 生成合成表格数据(UCI Adult),并评估保真度、实用性和隐私性(成员推理攻击)。包含隐私-实用性权衡扫描和 FastAPI 仪表板。
## 设置
```
python -m venv .venv
# Windows: .venv\Scripts\activate
# Unix: source .venv/bin/activate
pip install -r requirements.txt
pip install -e .
```
## 用法
- **准备数据并运行单次合成**:使用包中的 `load_adult`、`make_splits`、`run_synthesis`。
- **完整扫描和仪表板**:从项目根目录运行 `python run_sweep_and_dashboard.py`。这将运行完整扫描(5 个训练配置:10、50、100、200、300 个 epoch),将结果保存到 `data/sweep_results.json`,然后在 http://127.0.0.1:8000 启动 FastAPI 仪表板。打开该 URL 以探索权衡曲线,并点击任意点以查看该配置的完整保真度、实用性和隐私报告。
## 测试
```
pytest
```
所有测试均无需手动步骤即可运行;如果缺失,UCI Adult 将自动下载。
标签:Apex, AV绕过, CTGAN, DNS解析, FastAPI, pytest, Python, UCI Adult数据集, 人工智能, 合成数据生成, 安全规则引擎, 开源项目, 成员推理攻击, 数据仪表盘, 无后门, 机器学习, 模型评估, 生成对抗网络, 用户模式Hook绕过, 网络安全, 表格数据处理, 逆向工具, 隐私保护, 隐私-效用权衡