Ahmad-Gill/Deepfake-Audio-Detection-Real-vs.-Synthetically-Cloned-Voices

GitHub: Ahmad-Gill/Deepfake-Audio-Detection-Real-vs.-Synthetically-Cloned-Voices

基于ASVspoof 2019数据集和深度学习的音频深度伪造检测项目,通过二分类模型区分真实语音与AI合成克隆语音。

Stars: 0 | Forks: 0

# Deepfake 音频检测:真实语音 vs 合成克隆语音 本项目专注于检测音频片段是否为: - 真实人类语音 - AI 生成/克隆语音(spoofed) 我们使用 ASVspoof 2019 Logical Access 数据集,构建能够泛化到未知欺骗攻击的稳健二分类模型。 ## 目标 - 构建用于音频反欺骗的深度学习模型 - 提取和分析音频特征(MFCC、Spectrograms、CQCC) - 通过数据增强技术提高鲁棒性 - 评估对未知攻击的泛化能力 - 研究合成语音检测的失败案例和安全影响 ## 数据集 ASVspoof 2019 Logical Access(12.1万+ 条语音,107 位说话人,19 种欺骗系统) 任务: 二分类: - Bonafide(真实) - Spoof(合成) 潜在模型: - CNN - CRNN - ResNet - LSTM - 基于 Transformer 的音频模型 ## 🤖 AI 技能与开发指南 本仓库在 `skills/` 目录中包含 **AI 驱动的开发技能**,以加速你的工作: ### 可用技能 - **`implementation-guide/`** - 完整的编码、训练和调试指南 - **`midterm-report-writer/`** - 学术报告写作助手 - **`paper-reader/`** - 研究论文分析与总结 ### 如何使用技能 1. **对于实现工作**:询问有关编码、训练、调试的任何问题 - *“帮助我实现 RawNet2”* - *“我的训练没有收敛”* - *“我该如何计算 EER?”* 2. **对于报告撰写**:获取学术写作方面的帮助 - *“写我的方法论部分”* - *“帮助我分析这些结果”* 3. **对于研究**:获取论文摘要和见解 - *“总结 AASIST 论文”* - *“RawBoost 的关键发现是什么?”* ### 快速技能参考 ``` # 当你需要帮助时,自然地提问即可: "Set up my environment" → Environment setup guide "Debug my training" → Debugging assistance "Run experiments" → Experiment planning "Write evaluation section" → Report writing help ```
标签:AI安全, Apex, Chat Copilot, 凭据扫描, 声纹反欺骗, 机器学习, 逆向工具, 音频深度伪造检测, 音频特征工程