noobsmoker/telecursor

GitHub: noobsmoker/telecursor

该项目提供一套开源基础设施,用于在严格差分隐私保护下采集、筛选光标行为数据并训练因果Transformer模型。

Stars: 1 | Forks: 0

# TeleCursor [![CI/CD](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/1c36f83ab7213410.svg)](https://github.com/noobsmoker/telecursor/actions) [![Node.js](https://img.shields.io/node/v20.svg)](https://nodejs.org) [![Python](https://img.shields.io/badge/python-3.10+-blue.svg)](https://www.python.org) [![License](https://img.shields.io/github/license/noobsmoker/telecursor)](LICENSE) 开放用于光标行为研究的基础设施。提供用于理解人类-计算机交互运动层面的数据集与模型。 ## ✨ 功能 | 功能 | 描述 | |---------|-------------| | **差分隐私** | 浏览器本地 ε ≤ 3.0 的局部差分隐私,传输前处理 | | **因果变换器** | RoPE + SwiGLU 架构用于光标动态建模 | | **机器人检测** | 使用机器学习分类器进行自动轨迹过滤 | | **Manifest V3** | 现代 Chrome/Firefox 扩展 | | **Docker 就绪** | 使用 docker-compose 一键部署 | | **开放数据** | 采用 CC-BY-SA 许可的数据集并包含隐私覆盖层 | ## 概述 TeleCursor 收集自愿参与的光标遥测数据,提供正式差分隐私保证(ε ≤ 3.0),并基于人类导航模式训练基础模型。系统由以下组件构成: - **浏览器扩展**:在本地隐私约束下捕获光标轨迹 - **服务器**:接收、验证并存储匿名化遥测数据 - **数据集**:经过机器人检测和质量过滤的行为数据 - **模型**:采用因果变换器(RoPE、SwiGLU)并包含物理约束 所有组件均为开源。数据收集严格遵循自愿原则。不保留任何独占商业权利。 ## 文档 | 文档 | 描述 | |-----|-------------| | [📐 架构](docs/ARCHITECTURE.md) | 系统设计、组件与数据流 | | [🔌 API 参考](docs/API.md) | REST 端点、模式与身份验证 | | [🔒 隐私政策](docs/PRIVACY.md) | 差分隐私保证与威胁模型 | | [🤝 贡献指南](docs/CONTRIBUTING.md) | 开发环境搭建、代码规范与 PR 流程 | | [📋 数据模式](docs/API.md#data-schemas) | 轨迹、样本与事件结构 | ## 仓库结构 ``` telecursor/ ├── browser-extension/ # Chrome/Firefox extension (Manifest V3) │ ├── src/ │ │ ├── content.js # Cursor capture and local processing │ │ ├── background.js # Upload queue and sync │ │ ├── privacy/ # Local differential privacy implementation │ │ └── utils/ # Circular buffers, compression │ └── manifest.json ├── server/ # Node.js API server │ ├── src/ │ │ ├── index.js # Express server, rate limiting │ │ ├── db/ # SQLite with WAL mode │ │ ├── validation/ # JSON Schema, bot detection │ │ └── privacy/ # Aggregation, k-anonymity │ └── package.json ├── models/ # PyTorch training pipeline │ └── stage1_cursor_dynamics/ │ ├── model.py # Causal transformer with RoPE │ ├── train.py # Training loop with checkpointing │ ├── dataset.py # Trajectory loader, tokenizer │ ├── config.yaml # Hyperparameters │ └── bot_detector.py # Automated trajectory filtering ├── dataset/ # Data processing utilities │ └── preprocessing/ ├── docs/ # Documentation │ ├── ARCHITECTURE.md │ ├── API.md │ ├── PRIVACY.md │ └── CONTRIBUTING.md └── docker-compose.yml # Deployment configuration ``` ## 快速开始 ### 前置条件 - Node.js 20+ - Python 3.10+ - Chrome 109+ 或 Firefox 115+ ### 服务器 ``` cd server npm install npm run dev ``` 服务器在 `http://localhost:3000` 运行并支持热重载。 ### 浏览器扩展 1. 打开 Chrome → 扩展程序 → 开发者模式 2. 加载已解压的扩展程序 → 选择 `browser-extension/` 3. 在扩展选项中配置服务器 URL ### 模型训练 ``` cd models/stage1_cursor_dynamics pip install -r requirements.txt python train.py --data-dir /path/to/trajectories --config config.yaml ``` ## 隐私架构 在浏览器传输前应用本地差分隐私(拉普拉斯机制,ε=3.0)。服务器仅接收噪声聚合数据。详见 [docs/PRIVACY.md](docs/PRIVACY.md) 中的正式保证与威胁模型。 ## 贡献 参见 [docs/CONTRIBUTING.md](docs/CONTRIBUTING.md)。重点领域包括: - 模型架构(因果变换器、高效注意力机制) - 隐私工程(安全聚合、k-匿名性) - 浏览器扩展(Manifest V3、Web 加密 API) - 数据质量(机器人检测与验证) ## 许可证 MIT 许可证。参见 [LICENSE](LICENSE)。数据贡献采用 CC-BY-SA 并附带隐私覆盖层。 ## 引用 ``` @software{telecursor2025, title={TeleCursor: Open Infrastructure for Cursor Behavior Research}, author={TeleCursor Contributors}, year={2025}, url={https://github.com/noobsmoker/telecursor} } ``` ## 联系方式 - 问题反馈:[GitHub Issues](https://github.com/noobsmoker/telecursor/issues) - 安全邮箱:security@telecursor.ai - 研究咨询:research@telecursor.ai
标签:CC-BY-SA, Docker, docker-compose, Firefox扩展, GNU通用公共许可证, Manifest V3, MITM代理, Node.js, OPT-in, Python, RoPE, SwiGLU, TeleCursor, ε≤3.0, 人机交互, 人类运动层面, 光标动力学, 光标轨迹, 光标运动研究, 内核驱动漏洞利用, 凭据扫描, 因果Transformer, 基础模型, 安全防御评估, 局部差分隐私, 差分隐私, 开源数据, 无后门, 机器人检测, 浏览器扩展, 网络安全, 行为数据, 请求拦截, 质量过滤, 逆向工具, 隐私保护, 鼠标行为