rameezshafat/etsy-ai-image-detection
GitHub: rameezshafat/etsy-ai-image-detection
基于PyTorch的AI生成图像检测项目,通过训练CNN模型实现区分真实图像与AI合成图像的二分类任务。
Stars: 0 | Forks: 0
# AI 生成图像检测
本项目将提供的挑战资源重构为一个小型 PyTorch 项目,包含:
- 一个可复用的 `src/ai_image_detection` 包
- `notebooks/` 中的训练笔记本
- 用于加载数据、训练 CNN、评估结果和创建提交文件的简洁辅助函数
工作流程与 FashionMNIST 教程的结构相同:
1. 检查和可视化数据集
2. 构建 `Dataset` 和 `DataLoader` 对象
3. 定义基线计算机视觉模型
4. 使用可复用的训练/评估循环进行训练
5. 使用指标和混淆矩阵进行评估
6. 保存模型并创建测试预测
## 项目结构
```
.
├── notebooks/
│ └── 01_ai_generated_image_detection.ipynb
├── src/
│ └── ai_image_detection/
│ ├── __init__.py
│ ├── data.py
│ ├── engine.py
│ └── models.py
├── requirements.txt
└── [External] DCU 2026 ML challenge - external/
├── train.csv
├── test.csv
└── images_final_sample/
```
## 数据集说明
当前仓库快照包含:
- `train.csv`,包含 `4800` 个标签
- `test.csv`,包含 `2058` 个未标记的行
- `images_final_sample/`,包含 `6200` 个图像文件
这意味着并非每个 CSV 文件中的 ID 都在本地可用。笔记本和数据辅助工具会自动过滤到图像文件实际存在的行,因此您仍然可以在可用子集上进行训练和评估。
## 快速开始
```
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
```
然后打开:
`notebooks/01_ai_generated_image_detection.ipynb`
## 输出
笔记本设置为生成:
- 训练好的 CNN 检查点
- 验证指标
- 混淆矩阵
- 适用于可用测试图像的 `submission.csv` 文件
标签:AI内容检测, AI生成图像检测, Apex, CNN, F1分数, notebook, Python, PyTorch, 凭据扫描, 卷积神经网络, 图像分类, 图像识别, 提交生成, 数据加载, 数据管道, 无后门, 机器学习, 模型训练, 模型评估, 深度学习, 混淆矩阵, 特征工程, 计算机视觉, 软件工程, 逆向工具