Player1205/DataPassport-IQ
GitHub: Player1205/DataPassport-IQ
DataPassport-IQ 通过将 AI 数据集的 SHA-256 哈希锚定到区块链上,为训练数据提供去中心化的完整性公证与防篡改验证。
Stars: 1 | Forks: 0
# 🛡️ DataPassport
  
## 📋 项目概述
**DataPassport** 是一个基于 Web3 的平台,旨在保证 AI 训练数据集的完整性、来源和不可篡改性。通过将数据集的加密哈希直接锚定到 **Base Sepolia 区块链** 上,DataPassport 为 AI 数据创建了一个不可篡改的“护照”,确保机器学习模型是基于真实、未篡改的信息进行训练的。
## 🎯 问题:AI 数据中毒
随着人工智能系统深度融入关键基础设施(医疗、金融、自动驾驶),其训练数据的完整性变得至关重要。
* **数据篡改:** 恶意行为者可以巧妙地篡改数据集(数据中毒),从而在 AI 模型中引入偏见或后门。
* **黑盒困境:** AI 模型一旦完成训练,就极难追溯并证明究竟有哪些数据被输入其中。
* **缺乏信任:** 组织缺乏一种可验证的、去中心化的方式来证明其专有数据集随着时间的推移未遭到破坏。
## 💡 解决方案:加密公证
DataPassport 通过充当 AI 数据的去中心化公证员来解决这个问题。它不会将海量数据集存储在区块链上(因为成本极高)。相反,它会生成数据集的唯一加密指纹(**SHA-256 哈希**),并通过智能合约将*该哈希*锚定到区块链上。
如果原始数据集哪怕只有 1 个字节发生改变,生成的哈希也会完全不同,区块链验证将立即失败,从而将该数据标记为已损坏。
## ✨ 核心功能
- **客户端哈希引擎:** 使用 SHA-256 算法在浏览器本地对数据集进行哈希处理。这确保了海量或高度敏感的数据集无需为了验证而上传到中央服务器。
- **Base Sepolia 锚定:** 利用 Superchain 生态系统实现经济高效、高速的 Layer-2 区块链公证。
- **不可篡改的审计跟踪:** 一个透明、可公开验证的账本,准确显示数据集加盖时间戳的时间以及执行锚定的主体。
- **一键验证仪表盘:** 用户可以将数据集上传到平台,立即验证其当前哈希是否与永久锚定在区块链上的哈希一致。
## 🛡️ ArmorIQ 安全性(赛道 1:默认安全)
DataPassport 使用 **ArmorIQ** 积极保护数据集摄取 pipeline。
- **ArmorClaw 拦截器:** 实时扫描传入的数据集,在哈希处理*之前*拦截嵌入的漏洞利用、prompt 注入和结构性恶意软件特征。
- **失败即关闭护栏:** 任何未通过安全扫描的数据集都会被立即拦截,确保只有安全、经过验证的数据才能进入 Base Sepolia 区块链。
- **加密意图验证:** ArmorIQ SDK 注册并记录每一次执行意图,为 pipeline 的主动安全措施提供不可篡改的审计跟踪。
## ⚙️ 工作原理(数据流)
1. **数据集摄取** ➡️ 数据科学家选择一个数据集(CSV、JSON、图像语料库等)。
2. **SHA-256 哈希处理** ➡️ 平台的哈希引擎计算该文件唯一的 256 位加密哈希。
3. **智能合约执行** ➡️ 用户签署 Web3 交易,将哈希和元数据(名称、描述、时间戳)发送到 DataPassport 智能合约。
4. **区块链锚定** ➡️ 交易在 **Base Sepolia 网络** 上被挖掘,将哈希永久铭刻在不可篡改的账本中。
5. **未来验证** ➡️ 在训练 AI 模型之前,开发者可以通过 DataPassport 运行数据集。系统将计算哈希并将其与 Base 区块链进行核对。
- *匹配:* 数据是真实的 ✅
- *不匹配:* 数据已被篡改 ❌
## 💻 技术栈
### 前端与后端(MERN/Web3 桥梁)
* **框架:** React / Vite
* **样式:** Tailwind CSS
* **后端运行时:** Node.js + Express
* **哈希引擎:** Web Crypto API (SHA-256)
### Web3 基础设施
* **区块链网络:** Base Sepolia (Ethereum L2)
* **智能合约:** Solidity
* **Web3 集成:** Ethers.js / Viem
* **开发者控制台:** Superchain Dev Console
## 🏗️ 技术架构
```
[ Dataset File ]
↓
[ Client-Side SHA-256 Hashing Engine ] ← Data never leaves the browser
↓
[ Generated Hash: e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855 ]
↓
[ Web3 Wallet Signature (MetaMask / Coinbase Wallet) ]
↓
[ Smart Contract: storeDataHash(hash, metadata) ]
↓
[ 🔗 Anchored to Base Sepolia Blockchain ]
```
标签:MITM代理, Web3, Zenmap, 人工智能数据安全, 区块链, 哈希校验, 数据完整性, 数据溯源, 智能合约, 自动化攻击