noobsmoker/telecursor
GitHub: noobsmoker/telecursor
该项目提供一套开源基础设施,用于在严格差分隐私保护下采集、筛选光标行为数据并训练因果Transformer模型。
Stars: 1 | Forks: 0
# TeleCursor
[](https://github.com/noobsmoker/telecursor/actions)
[](https://nodejs.org)
[](https://www.python.org)
[](LICENSE)
开放用于光标行为研究的基础设施。提供用于理解人类-计算机交互运动层面的数据集与模型。
## ✨ 功能
| 功能 | 描述 |
|---------|-------------|
| **差分隐私** | 浏览器本地 ε ≤ 3.0 的局部差分隐私,传输前处理 |
| **因果变换器** | RoPE + SwiGLU 架构用于光标动态建模 |
| **机器人检测** | 使用机器学习分类器进行自动轨迹过滤 |
| **Manifest V3** | 现代 Chrome/Firefox 扩展 |
| **Docker 就绪** | 使用 docker-compose 一键部署 |
| **开放数据** | 采用 CC-BY-SA 许可的数据集并包含隐私覆盖层 |
## 概述
TeleCursor 收集自愿参与的光标遥测数据,提供正式差分隐私保证(ε ≤ 3.0),并基于人类导航模式训练基础模型。系统由以下组件构成:
- **浏览器扩展**:在本地隐私约束下捕获光标轨迹
- **服务器**:接收、验证并存储匿名化遥测数据
- **数据集**:经过机器人检测和质量过滤的行为数据
- **模型**:采用因果变换器(RoPE、SwiGLU)并包含物理约束
所有组件均为开源。数据收集严格遵循自愿原则。不保留任何独占商业权利。
## 文档
| 文档 | 描述 |
|-----|-------------|
| [📐 架构](docs/ARCHITECTURE.md) | 系统设计、组件与数据流 |
| [🔌 API 参考](docs/API.md) | REST 端点、模式与身份验证 |
| [🔒 隐私政策](docs/PRIVACY.md) | 差分隐私保证与威胁模型 |
| [🤝 贡献指南](docs/CONTRIBUTING.md) | 开发环境搭建、代码规范与 PR 流程 |
| [📋 数据模式](docs/API.md#data-schemas) | 轨迹、样本与事件结构 |
## 仓库结构
```
telecursor/
├── browser-extension/ # Chrome/Firefox extension (Manifest V3)
│ ├── src/
│ │ ├── content.js # Cursor capture and local processing
│ │ ├── background.js # Upload queue and sync
│ │ ├── privacy/ # Local differential privacy implementation
│ │ └── utils/ # Circular buffers, compression
│ └── manifest.json
├── server/ # Node.js API server
│ ├── src/
│ │ ├── index.js # Express server, rate limiting
│ │ ├── db/ # SQLite with WAL mode
│ │ ├── validation/ # JSON Schema, bot detection
│ │ └── privacy/ # Aggregation, k-anonymity
│ └── package.json
├── models/ # PyTorch training pipeline
│ └── stage1_cursor_dynamics/
│ ├── model.py # Causal transformer with RoPE
│ ├── train.py # Training loop with checkpointing
│ ├── dataset.py # Trajectory loader, tokenizer
│ ├── config.yaml # Hyperparameters
│ └── bot_detector.py # Automated trajectory filtering
├── dataset/ # Data processing utilities
│ └── preprocessing/
├── docs/ # Documentation
│ ├── ARCHITECTURE.md
│ ├── API.md
│ ├── PRIVACY.md
│ └── CONTRIBUTING.md
└── docker-compose.yml # Deployment configuration
```
## 快速开始
### 前置条件
- Node.js 20+
- Python 3.10+
- Chrome 109+ 或 Firefox 115+
### 服务器
```
cd server
npm install
npm run dev
```
服务器在 `http://localhost:3000` 运行并支持热重载。
### 浏览器扩展
1. 打开 Chrome → 扩展程序 → 开发者模式
2. 加载已解压的扩展程序 → 选择 `browser-extension/`
3. 在扩展选项中配置服务器 URL
### 模型训练
```
cd models/stage1_cursor_dynamics
pip install -r requirements.txt
python train.py --data-dir /path/to/trajectories --config config.yaml
```
## 隐私架构
在浏览器传输前应用本地差分隐私(拉普拉斯机制,ε=3.0)。服务器仅接收噪声聚合数据。详见 [docs/PRIVACY.md](docs/PRIVACY.md) 中的正式保证与威胁模型。
## 贡献
参见 [docs/CONTRIBUTING.md](docs/CONTRIBUTING.md)。重点领域包括:
- 模型架构(因果变换器、高效注意力机制)
- 隐私工程(安全聚合、k-匿名性)
- 浏览器扩展(Manifest V3、Web 加密 API)
- 数据质量(机器人检测与验证)
## 许可证
MIT 许可证。参见 [LICENSE](LICENSE)。数据贡献采用 CC-BY-SA 并附带隐私覆盖层。
## 引用
```
@software{telecursor2025,
title={TeleCursor: Open Infrastructure for Cursor Behavior Research},
author={TeleCursor Contributors},
year={2025},
url={https://github.com/noobsmoker/telecursor}
}
```
## 联系方式
- 问题反馈:[GitHub Issues](https://github.com/noobsmoker/telecursor/issues)
- 安全邮箱:security@telecursor.ai
- 研究咨询:research@telecursor.ai
标签:CC-BY-SA, Docker, docker-compose, Firefox扩展, GNU通用公共许可证, Manifest V3, MITM代理, Node.js, OPT-in, Python, RoPE, SwiGLU, TeleCursor, ε≤3.0, 人机交互, 人类运动层面, 光标动力学, 光标轨迹, 光标运动研究, 内核驱动漏洞利用, 凭据扫描, 因果Transformer, 基础模型, 安全防御评估, 局部差分隐私, 差分隐私, 开源数据, 无后门, 机器人检测, 浏览器扩展, 网络安全, 行为数据, 请求拦截, 质量过滤, 逆向工具, 隐私保护, 鼠标行为