vineet-crypto/Deepfake-Audio-Detection

GitHub: vineet-crypto/Deepfake-Audio-Detection

基于CNN的深度学习系统,通过Mel频谱图特征对音频进行真假二分类,解决AI生成语音(Deepfake音频)的检测问题。

Stars: 0 | Forks: 0

# 🎙️ Deepfake 音频检测 一个用于将语音录音分类为**真实(人类)**或**Deepfake(AI 生成)**的深度学习系统。 ## 🧠 方法论 - **特征提取:** 使用 `librosa` 将原始 `.wav` 文件转换为 Mel Spectrograms(128 个 Mel 频段,16kHz 采样率,最长 4 秒)。 - **模型:** 一个自定义的 CNN(`DeepfakeAudioDetectorCNN`),包含 3 个卷积块、batch normalization、dropout 以及用于二分类的 sigmoid 输出。 - **训练:** BCELoss + Adam 优化器 (lr=0.001),5 个 epoch,80/20 的训练-验证集比例。 - **阈值:** 在评估阶段计算 EER 最优决策阈值,而不是使用固定的 0.5。 ## 📊 结果 | 指标 | 要求 | 达成 | |--------|----------|----------| | 准确率 (Accuracy) | ≥ 80% | 99.37% | | EER | ≤ 12% | 0.61% | | F1 Score | ≥ 80% | 99.37% | ## 🚀 安装与使用 ``` pip install -r requirements.txt ``` **训练模型:** 运行 `deepfake_audio_detector.ipynb` 全过程。 **测试新的音频文件:** ``` python inference.py --audio_path /path/to/audio.wav ``` **运行 Web 应用:** ``` streamlit run app.py ``` ## 🌐 数据集 [The Fake-or-Real Dataset](https://www.kaggle.com/datasets/mohammedabdeldayem/the-fake-or-real-dataset) — `LA norm` 目录下的 `train` 文件夹。 ## 📄 许可证 作为 **Mars Open Project 2026** 的一部分提交,用于教育和研究目的。
标签:Apex, CNN, Kubernetes, Streamlit, 凭据扫描, 机器学习, 深度伪造检测, 深度学习, 访问控制, 逆向工具, 音频处理