hexsyro/Anti-Scraping-Playwright
GitHub: hexsyro/Anti-Scraping-Playwright
基于Playwright Python构建的生产级反封锁爬虫框架,通过UA轮换、代理切换、Tor集成和拟人化行为等高级规避技术帮助用户绕过常见反爬虫机制。
Stars: 0 | Forks: 0
# 适用于 Playwright Python 的反封锁网页爬虫
一个生产就绪、功能丰富的网页抓取框架,使用高级规避技术绕过常见的反爬虫机制。
## 功能特性
### 1. **User Agent 轮换**
- 每次会话自动轮换
- 5+ 个默认的现代 User Agent
- 支持自定义 User Agent 列表
### 2. **代理轮换**
- 轮询 (Round-robin) 代理切换
- 支持 HTTP、HTTPS、SOCKS5
- 支持需身份验证的代理
- **Tor 浏览器集成**
### 3. **拟人
标签:Canvas指纹, DNS 解析, Playwright, Python, SOCKS5代理, Stealth模式, Tor浏览器, User-Agent轮换, WebGL伪装, Web抓取, 人类行为模拟, 代理IP轮换, 代理池, 会话管理, 反指纹识别, 反爬虫绕过, 命令控制, 数据采集, 无后门, 无头浏览器, 浏览器自动化, 爬虫框架, 特征检测, 网络安全, 蜜罐检测, 逆向工具, 隐私保护, 验证码绕过