vineet-crypto/Deepfake-Audio-Detection

GitHub: vineet-crypto/Deepfake-Audio-Detection

基于CNN的深度学习系统，通过Mel频谱图特征对音频进行真假二分类，解决AI生成语音（Deepfake音频）的检测问题。

Stars: 0 | Forks: 0

# 🎙️ Deepfake 音频检测一个用于将语音录音分类为**真实（人类）**或**Deepfake（AI 生成）**的深度学习系统。 ## 🧠 方法论 - **特征提取：** 使用 `librosa` 将原始 `.wav` 文件转换为 Mel Spectrograms（128 个 Mel 频段，16kHz 采样率，最长 4 秒）。 - **模型：** 一个自定义的 CNN（`DeepfakeAudioDetectorCNN`），包含 3 个卷积块、batch normalization、dropout 以及用于二分类的 sigmoid 输出。 - **训练：** BCELoss + Adam 优化器 (lr=0.001)，5 个 epoch，80/20 的训练-验证集比例。 - **阈值：** 在评估阶段计算 EER 最优决策阈值，而不是使用固定的 0.5。 ## 📊 结果 | 指标 | 要求 | 达成 | |--------|----------|----------| | 准确率 (Accuracy) | ≥ 80% | 99.37% | | EER | ≤ 12% | 0.61% | | F1 Score | ≥ 80% | 99.37% | ## 🚀 安装与使用 ``` pip install -r requirements.txt ``` **训练模型：** 运行 `deepfake_audio_detector.ipynb` 全过程。 **测试新的音频文件：** ``` python inference.py --audio_path /path/to/audio.wav ``` **运行 Web 应用：** ``` streamlit run app.py ``` ## 🌐 数据集 [The Fake-or-Real Dataset](https://www.kaggle.com/datasets/mohammedabdeldayem/the-fake-or-real-dataset) — `LA norm` 目录下的 `train` 文件夹。 ## 📄 许可证作为 **Mars Open Project 2026** 的一部分提交，用于教育和研究目的。

标签：Apex, CNN, Kubernetes, Streamlit, 凭据扫描, 机器学习, 深度伪造检测, 深度学习, 访问控制, 逆向工具, 音频处理