Ahmad-Gill/Deepfake-Audio-Detection-Real-vs.-Synthetically-Cloned-Voices
GitHub: Ahmad-Gill/Deepfake-Audio-Detection-Real-vs.-Synthetically-Cloned-Voices
基于ASVspoof 2019数据集和深度学习的音频深度伪造检测项目,通过二分类模型区分真实语音与AI合成克隆语音。
Stars: 0 | Forks: 0
# Deepfake 音频检测:真实语音 vs 合成克隆语音
本项目专注于检测音频片段是否为:
- 真实人类语音
- AI 生成/克隆语音(spoofed)
我们使用 ASVspoof 2019 Logical Access 数据集,构建能够泛化到未知欺骗攻击的稳健二分类模型。
## 目标
- 构建用于音频反欺骗的深度学习模型
- 提取和分析音频特征(MFCC、Spectrograms、CQCC)
- 通过数据增强技术提高鲁棒性
- 评估对未知攻击的泛化能力
- 研究合成语音检测的失败案例和安全影响
## 数据集
ASVspoof 2019 Logical Access(12.1万+ 条语音,107 位说话人,19 种欺骗系统)
任务:
二分类:
- Bonafide(真实)
- Spoof(合成)
潜在模型:
- CNN
- CRNN
- ResNet
- LSTM
- 基于 Transformer 的音频模型
## 🤖 AI 技能与开发指南
本仓库在 `skills/` 目录中包含 **AI 驱动的开发技能**,以加速你的工作:
### 可用技能
- **`implementation-guide/`** - 完整的编码、训练和调试指南
- **`midterm-report-writer/`** - 学术报告写作助手
- **`paper-reader/`** - 研究论文分析与总结
### 如何使用技能
1. **对于实现工作**:询问有关编码、训练、调试的任何问题
- *“帮助我实现 RawNet2”*
- *“我的训练没有收敛”*
- *“我该如何计算 EER?”*
2. **对于报告撰写**:获取学术写作方面的帮助
- *“写我的方法论部分”*
- *“帮助我分析这些结果”*
3. **对于研究**:获取论文摘要和见解
- *“总结 AASIST 论文”*
- *“RawBoost 的关键发现是什么?”*
### 快速技能参考
```
# 当你需要帮助时,自然地提问即可:
"Set up my environment" → Environment setup guide
"Debug my training" → Debugging assistance
"Run experiments" → Experiment planning
"Write evaluation section" → Report writing help
```
标签:AI安全, Apex, Chat Copilot, 凭据扫描, 声纹反欺骗, 机器学习, 逆向工具, 音频深度伪造检测, 音频特征工程