avneet1604/deepfake-voice-detection-ml
GitHub: avneet1604/deepfake-voice-detection-ml
基于随机森林和Librosa的音频深度伪造检测工具,通过提取声学特征实现真假语音二分类。
Stars: 0 | Forks: 0
# AudioDeepFakeDetection
利用人工智能检测音频文件原始性的应用程序。
## 环境设置
```
# 确保您的 PIP 是最新的
pip install -U pip wheel setuptools
# 安装所需的依赖项
pip install -r requirements.txt
```
## 数据集设置
你可以从以下 URL 下载项目中使用的数据集:
https://drive.google.com/file/d/1O_PckJtEbQWlHEMSA5gDdxRooa1S1N2p/view
- (真实) 人声数据集:
- 该数据集包含 10,000 段短音频片段,由一位说话者朗读 7 本非虚构类书籍的段落。
- (虚假) 合成语音数据集:
- 该数据集包含虚假音频片段(16-bit PCM wav)。
下载数据集后,你可以将它们分别解压到 `data/real` 和 `data/fake` 目录下。最终,`data` 目录的结构应如下所示:
```
data
├── real
└── LJ001-0001
└── LJ001-0002
└── LJ001-0003
└── LJ001-0004
└── LJ001-0005
└── LJ001-0006
...
└── fake
└── LJ001-0001_gen
└── LJ001-0002_gen
└── LJ001-0003_gen
└── LJ001-0004_gen
└── LJ001-0005_gen
└── LJ001-0006_gen
...
```
## 应用程序
你可以运行名为 [main.py](main.py) 的文件并加载你的音频文件,以测试该文件是真实的还是虚假的。

## 许可证
本项目基于 [MIT 许可证](LICENSE) 授权。
标签:AI安全, Apex, Chat Copilot, Librosa, Python, 人工智能, 信号处理, 合成语音检测, 数字取证, 数据科学, 无后门, 机器学习, 深度伪造, 深度伪造检测, 特征提取, 用户模式Hook绕过, 自动化脚本, 虚假音频识别, 资源验证, 逆向工具, 随机森林, 音频分类, 音频鉴伪