elalgil/VeriScan

GitHub: elalgil/VeriScan

集成深度学习与传统取证算法的图像安全分析平台,用于检测 AI 生成内容、隐写攻击和数字篡改,并提供自动清理功能。

Stars: 0 | Forks: 0

# VeriScan:用于基于图像的威胁检测、清理与内容认证的综合网络安全工具 **VeriScan** 是一款先进的 **网络安全与数字认证** 解决方案,旨在赋予用户以取证级的精度分析数字内容的能力。该平台提供了一套强大的工具套件,用于检测多种图像伪造行为,同时作为 Vision-Language Models (VLMs) 抵御恶意视觉提示注入的关键防御层。 ## 入门指南 ### 1. 环境设置 克隆仓库并安装必要的 Python 依赖项: ``` git clone https://github.com/elalgil/VeriScan.git cd VeriScan pip install -r requirements.txt ``` ### 2. 前端安装 进入前端目录并安装 npm 包: ``` cd frontend npm install ``` ### 3. 启动平台 运行自动化批处理脚本以同时启动后端 和前端: ``` veriscan.bat ``` ### 4. 下载模型权重 在执行代码之前,您必须下载 ResNet50 和 SRNet 模型的预训练权重文件。可以在以下链接找到它们: [ResNet50 权重](https://github.com/PeterWang512/CNNDetection/tree/master/weights)。 [Residual Network 权重](https://dde.binghamton.edu/download/alaska/)。 Backend API: http://127.0.0.1:8000 Frontend Dashboard: 查看 Vite 终端输出 (默认: http://localhost:5173) ## 基于图像的攻击载体:分析与缓解范围 在生成式 AI 和复杂数字编辑的时代,图像不再是静态资产——它们是潜在的攻击载体。VeriScan 能够识别那些肉眼和传统安全过滤器无法察觉的隐藏威胁: **文档伪造检测:** 数字内容可能通过图像拼接和外部对象插入进行篡改。可以通过揭示 JPEG 压缩级别的不一致性来识别,这表明存在隐藏的编辑。 **宣传与虚假信息:** 包含“克隆”对象(武器、抗议者或画面内重复对象)的图像可能被用于传播虚假信息、宣传以及制造误导性叙事。可以通过检测图像内的“近乎相同”的兴趣点来识别。 **身份完整性:** 官方机构需要高完整性的面部图像用于安全和文档记录,但编辑过的图像可能会干扰自动验证系统。因此,可以通过识别统计噪声异常来检测护照和政府身份证中未经授权的局部修饰或不自然模糊,从而证明图像是不真实的。 **AI 生成内容与深度伪造:** AI 生成的图像在社交媒体上激增,往往助长了虚假信息活动。由基于 GAN 的模型创建的合成媒体会留下“数学指纹”——即人眼看不见的潜在伪影。可以使用专门的预训练神经网络识别这些微妙的特征,从而对数字内容进行认证。 **隐写恶意软件与中和 VPI:** Vision-Language Models (VLMs) 越来越容易受到 Visual Prompt Injections (VPI) 的攻击——即嵌入在像素内的隐藏恶意提示(隐写恶意软件),旨在劫持模型行为或窃取敏感数据。我们可以通过结合高保真 SRNet 神经分析与高级统计诊断来揭示这些不可见的威胁。通过在图像到达 AI 之前对其进行清理,我们保护了视觉处理管道并消除了隐写载荷。 ## 核心诊断模块 VeriScan 集成了一个多层分析管道,结合了经典的计算机视觉启发式方法与深度残差神经网络。 ### Error Level Analysis (ELA) * **功能:** 通过分析 JPEG 压缩伪影和像素级差异来识别数字篡改。 * **研究基础:** *Tehnici de verificare a autenticității imaginilor – ELA*。[Error Level Analysis](documents/error%20level%20analysis.pdf) * **实现:** 改编自 [killerzman/Python-ELA](https://github.com/killerzman/Python-ELA/tree/main)。 ### Copy-Move Forgery Detection * **功能:** 检测图像区域被复制以隐藏对象的内部克隆。 * **原理:** 采用 SIFT 关键点提取、基于 FLANN 的匹配以及 RANSAC 几何验证。 * **数据集:** [CoMoFoD Dataset](https://www.vcl.fer.hr/comofod/examples.html)。 * **参考:** *An Evaluation of Popular Copy-Move Forgery Detection Approaches*。[Move-Copy Research](documents/move-copy-forgery-detection.pdf) ### Noise Variance Analysis (模糊检测) * **功能:** 估算加性零均值高斯噪声,以识别修饰或不自然的模糊伪影。 * **原理:** John Immerkær 的 *Fast Noise Variance Estimation*。[Fast Noise Variance Research](documents/noise%20variance.pdf) * **数据集:** [CUHK Blur Detection Dataset](https://www.cse.cuhk.edu.hk/~leojia/projects/dblurdetect/dataset.html)。 ### 基于 CNN 的 AI 检测 * **功能:** 通过检测架构性的 CNN 指纹,识别由 GAN 和其他深度学习生成器合成的图像。 * **研究基础:** UC Berkeley 和 Adobe Research。[CNN Detection Research](documents/CNN%20detection.pdf) * **资源:** 预训练权重和脚本可在 [CNNDetection GitHub](https://github.com/PeterWang512/CNNDetection/tree/master) 找到。 * **设置:** 利用 `download_testset.sh` 获取针对 Blur+JPEG 鲁棒性优化的 ResNet50 模型权重。 ### Steganographic Image Injection 检测器 * **功能:** 一个高级编排器,用于识别隐藏的文本命令和恶意载荷。 * **神经网络架构:** 利用转换为 ONNX 的 **SRNet** (Steganalysis Residual Network) 进行 3 通道 RGB 分析。 * **检测堆栈:** 聚合 **Chi-Square (20%)**、**Sample Pair Analysis (20%)**、**Entropy (20%)** 和 **Neural (40%)** 分数。 * **研究基础:** *Invisible Injections: Exploiting Vision-Language Models Through Steganographic Prompt Embedding*。[Image injection Research](documents/image%20injection.pdf) * **训练/权重:** 在 **ALASKA-1** 挑战数据集上训练。模型可通过 [DDE Lab Website](https://dde.binghamton.edu/download/alaska/) 的“Breaking ALASKA”部分获得。 ## 缓解措施:图像清理器 VeriScan 不仅能检测,还能保护。对于被标记为具有高隐写风险的图像,系统提供了一个自动化的 **清理引擎**: * **Gaussian Blur:** 破坏神经隐写术使用的高频噪声特征。 * **Strategic Re-compression:** 在保持视觉实用性的同时中和基于 LSB 的注入。 ## 系统架构 * **Frontend:** 使用 **React** 构建,具有带有实时 **Heatmaps** 和统一 **Risk Scoring** 的取证仪表板。 * **Backend:** 高性能 **FastAPI** 编排器。 * **AI/ML 技术:** 用于 SRNet 推理的 **ONNX Runtime** 和用于 CNN 检测的 **PyTorch**。 ## 项目结构与层级 VeriScan 遵循解耦架构,其中核心逻辑与交付层(Web API 和 UI)隔离。 ### 目录树 ``` VeriScan app/ ├── backend/ # FastAPI Application Server │ └── main.py # API Entry point and module orchestration ├── frontend/ # React + Vite Forensic Dashboard │ ├── src/ # UI Components and state management │ └── vite.config.js # Frontend build configuration ├── verification_manager/ # Core Forensic & Detection Engines │ ├── cnn_detection_engine/ # GAN/AI detection logic │ ├── image_authentication_engine/# Classical forensic modules │ │ ├── compression_artifact_analyzer.py # ELA Analysis │ │ ├── copy_move_forg_detect_alg.py # Cloning detection │ │ └── noise_consistency_analyzer.py # Noise variance analysis │ ├── injection_defense_engine/ # Steganography & SPI defense │ │ ├── models/ # ONNX model weights (SRNet/ALASKA) │ │ ├── chi_square_analyzer.py # LSB statistical analysis │ │ ├── steg_detector_srnet.py # Neural steganography detection │ │ └── image_injection_detector.py # Result aggregation logic │ └── verification_manager.py # Primary orchestrator logic ├── resNet_trainer/ # Scripts for training/fine-tuning the CNN models ├── steg injection generator/ # Toolset for creating test injection samples ├── test images/ # Repository of authentic and forged samples for testing ├── documents/ # Repository of all theory articles behind algorithms ├── requirements.txt # Python dependency manifest └── veriscan.bat # Automated cross-platform system launcher ``` ### 关键文件夹描述 `backend/`:托管 FastAPI 实现。它处理图像摄取,调用必要的分析引擎,并将 JSON 格式的取证报告返回给前端。 `verification_manager/`:系统的“智能层”。它被细分为专门的引擎,确保经典取证与基于神经的威胁检测保持解耦。 `image_authentication_engine/`:包含用于检测标准伪造的确定性算法(ELA、Noise Variance、Move-Copy)。 `injection_defense_engine/`:管理专注于识别隐藏载荷和对抗性注入的 SRNet 和统计模块(Chi-Square、SPA)。 `resNet_trainer/`:包括用于 CNN AI 检测模块的训练管道,允许随着新生成技术的出现进行未来的模型更新。 `frontend/`:标准的 Vite/React 项目结构。src/ 文件夹包含取证可视化逻辑,包括热力图和统一信任分数的渲染。 `assets/`:代码中实现的算法背后的理论背景和文章。 ## 文档:规格与设计 仓库包含一份详尽的 **规格文档** (`System Specification Document.pdf`),它是 VeriScan 平台的正式技术蓝图。 ### 内容包含什么? * **执行摘要与使命:** 详细的项目愿景,侧重于现代网络安全中 **检测** 与 **完整性认证** 的双重角色。 * **问题定义:** 深入分析与 **文档伪造** 和针对 Large Language Models (LLMs) 的 **Visual Prompt Injections (VPI)** 相关的风险。 * **系统架构:** 详细解释模块化 **FastAPI** 后端、**React** 取证仪表板以及标准化的 **认证算法协议**。 * **算法深度剖析:** 每个诊断模块的综合数学和逻辑分解: * **ELA (Error Level Analysis):** 压缩伪影理论。 * **Copy-Move Detection:** 使用 SIFT、FLANN 和 RANSAC 的基于关键点的逻辑。 * **Noise Variance Estimation:** Immerkær 掩码的数学基础。 * **CNN Detection:** ResNet50 指纹和 Grad-CAM 可视化。 * **Image Injection Engine:** 神经隐写术 (SRNet) 和统计 LSB 分析。 * **测试与验证:** 使用 **CASIA 2.0**、**CoMoFoD**、**CUHK** 和 **ALASKA-1** 等数据集的基准测试策略。 * **学术参考书目:** 构成系统理论基础的完整研究论文和学术来源列表。 ## 作者 **Elal Gilboa** *耶路撒冷希伯来大学计算机科学学生* 专注于 **计算机视觉** 与 **网络安全** 的交叉领域,特别是在神经隐写分析和数字取证领域。
标签:AV绕过, CNN-GAN, DNS 反向解析, DNS 解析, FastAPI, Python, React, ResNet50, SRNet, Syscalls, 内容认证, 凭据扫描, 图像去噪, 图像取证, 复制移动检测, 提示注入防御, 数字取证, 数字图像鉴别, 文档伪造检测, 无后门, 深度学习, 源代码安全, 生成式AI安全, 篡改检测, 网络安全, 自动化脚本, 虚假信息检测, 虚拟机, 视觉语言模型安全, 计算机视觉, 误差水平分析, 逆向工具, 隐写分析, 隐写术, 隐私保护