vineet-crypto/Deepfake-Audio-Detection
GitHub: vineet-crypto/Deepfake-Audio-Detection
基于CNN的深度学习系统,通过Mel频谱图特征对音频进行真假二分类,解决AI生成语音(Deepfake音频)的检测问题。
Stars: 0 | Forks: 0
# 🎙️ Deepfake 音频检测
一个用于将语音录音分类为**真实(人类)**或**Deepfake(AI 生成)**的深度学习系统。
## 🧠 方法论
- **特征提取:** 使用 `librosa` 将原始 `.wav` 文件转换为 Mel Spectrograms(128 个 Mel 频段,16kHz 采样率,最长 4 秒)。
- **模型:** 一个自定义的 CNN(`DeepfakeAudioDetectorCNN`),包含 3 个卷积块、batch normalization、dropout 以及用于二分类的 sigmoid 输出。
- **训练:** BCELoss + Adam 优化器 (lr=0.001),5 个 epoch,80/20 的训练-验证集比例。
- **阈值:** 在评估阶段计算 EER 最优决策阈值,而不是使用固定的 0.5。
## 📊 结果
| 指标 | 要求 | 达成 |
|--------|----------|----------|
| 准确率 (Accuracy) | ≥ 80% | 99.37% |
| EER | ≤ 12% | 0.61% |
| F1 Score | ≥ 80% | 99.37% |
## 🚀 安装与使用
```
pip install -r requirements.txt
```
**训练模型:** 运行 `deepfake_audio_detector.ipynb` 全过程。
**测试新的音频文件:**
```
python inference.py --audio_path /path/to/audio.wav
```
**运行 Web 应用:**
```
streamlit run app.py
```
## 🌐 数据集
[The Fake-or-Real Dataset](https://www.kaggle.com/datasets/mohammedabdeldayem/the-fake-or-real-dataset) — `LA norm` 目录下的 `train` 文件夹。
## 📄 许可证
作为 **Mars Open Project 2026** 的一部分提交,用于教育和研究目的。
标签:Apex, CNN, Kubernetes, Streamlit, 凭据扫描, 机器学习, 深度伪造检测, 深度学习, 访问控制, 逆向工具, 音频处理