rameezshafat/etsy-ai-image-detection

GitHub: rameezshafat/etsy-ai-image-detection

基于PyTorch的AI生成图像检测项目,通过训练CNN模型实现区分真实图像与AI合成图像的二分类任务。

Stars: 0 | Forks: 0

# AI 生成图像检测 本项目将提供的挑战资源重构为一个小型 PyTorch 项目,包含: - 一个可复用的 `src/ai_image_detection` 包 - `notebooks/` 中的训练笔记本 - 用于加载数据、训练 CNN、评估结果和创建提交文件的简洁辅助函数 工作流程与 FashionMNIST 教程的结构相同: 1. 检查和可视化数据集 2. 构建 `Dataset` 和 `DataLoader` 对象 3. 定义基线计算机视觉模型 4. 使用可复用的训练/评估循环进行训练 5. 使用指标和混淆矩阵进行评估 6. 保存模型并创建测试预测 ## 项目结构 ``` . ├── notebooks/ │ └── 01_ai_generated_image_detection.ipynb ├── src/ │ └── ai_image_detection/ │ ├── __init__.py │ ├── data.py │ ├── engine.py │ └── models.py ├── requirements.txt └── [External] DCU 2026 ML challenge - external/ ├── train.csv ├── test.csv └── images_final_sample/ ``` ## 数据集说明 当前仓库快照包含: - `train.csv`,包含 `4800` 个标签 - `test.csv`,包含 `2058` 个未标记的行 - `images_final_sample/`,包含 `6200` 个图像文件 这意味着并非每个 CSV 文件中的 ID 都在本地可用。笔记本和数据辅助工具会自动过滤到图像文件实际存在的行,因此您仍然可以在可用子集上进行训练和评估。 ## 快速开始 ``` python -m venv .venv source .venv/bin/activate pip install -r requirements.txt ``` 然后打开: `notebooks/01_ai_generated_image_detection.ipynb` ## 输出 笔记本设置为生成: - 训练好的 CNN 检查点 - 验证指标 - 混淆矩阵 - 适用于可用测试图像的 `submission.csv` 文件
标签:AI内容检测, AI生成图像检测, Apex, CNN, F1分数, notebook, Python, PyTorch, 凭据扫描, 卷积神经网络, 图像分类, 图像识别, 提交生成, 数据加载, 数据管道, 无后门, 机器学习, 模型训练, 模型评估, 深度学习, 混淆矩阵, 特征工程, 计算机视觉, 软件工程, 逆向工具