clayhackergroup/spidey-crack
GitHub: clayhackergroup/spidey-crack
一款基于 Python 的 PDF 密码破解与文本提取工具,支持多进程字典攻击并可将提取内容导出为多种格式。
Stars: 0 | Forks: 0
███████╗██████╗ ██╗██████╗ ███████╗██╗ ██╗
██╔════╝██╔══██╗██║██╔══██╗██╔════╝╚██╗ ██╔╝
███████╗██████╔╝██║██║ ██║█████╗ ╚████╔╝
╚════██║██╔═══╝ ██║██║ ██║██╔══╝ ╚██╔╝
███████║██║ ██║██████╔╝███████╗ ██║
╚══════╝╚═╝ ╚═╝╚═════╝ ╚══════╝ ╚═╝
专业的 PDF 密码破解与文本提取工具
基于 pypdf | 多进程处理 | 多格式输出
功能 •
安装 •
用法 •
比较 •
赞助 •
开发者
## 功能
| 功能 | 描述 |
|---------|-------------|
| **密码破解** | 使用内置常用密码或外部字典对 PDF 密码进行暴力破解 |
| **多进程处理** | 并行利用所有可用的 CPU 核心,以达到最高速度 |
| **速率限制** | 可配置的密码/秒速率或无限速模式 |
| **文本提取** | 逐页从已解密的 PDF 中提取文本 |
| **多种输出格式** | 纯文本、原始数据、JSON(包含页面结构) |
| **元数据导出** | 查看 PDF 元数据(作者、标题、主题等) |
| **进度显示** | 带有预计剩余时间 (ETA) 和旋转动画的实时进度条 |
| **彩色终端** | ANSI 彩色输出,提升可读性 |
| **PowerShell 封装脚本** | 为 Windows 用户提供便捷的 `.ps1` 封装脚本 |
## 安装
```
# 克隆 repository
git clone https://github.com/clayhackergroup/spidey-crack.git
cd spidey-crack
# 安装 dependencies
pip install pypdf
```
## 用法
### 基本用法
```
# 尝试内置常见密码
python readpdf.py protected.pdf
# 尝试特定密码
python readpdf.py protected.pdf mypassword123
```
### 字典攻击
```
# 使用 wordlist (以 @ 为前缀)
python readpdf.py protected.pdf @rockyou.txt
# Max speed, 无限速率
python readpdf.py protected.pdf @rockyou.txt --unlimited
# 自定义速度 (100 个密码/秒)
python readpdf.py protected.pdf @rockyou.txt -s 100
```
### 输出选项
```
# 将提取的文本保存到 file
python readpdf.py protected.pdf password123 -o output.txt
# 带页面结构的 JSON output
python readpdf.py protected.pdf password123 --json
# Raw text (无页面分隔符)
python readpdf.py protected.pdf password123 --raw
# 仅查看 metadata
python readpdf.py protected.pdf --meta
```
### PowerShell (Windows)
```
.\spidey.ps1 protected.pdf -Password @rockyou.txt -Unlimited -Json -o result.json
```
### 高级选项
```
OPTIONS:
-s, --speed N Passwords/sec (default: 10)
--unlimited Max speed (no rate limit)
--no-brute Skip built-in passwords
-o, --output FILE Save text to file
--json JSON output
--raw Raw text (no separators)
--meta Metadata only
-q, --quiet No progress output
--version Show version
--help This message
```
## 工作原理
1. **密码收集** — 直接输入密码或使用字典(通过 `@file.txt`)。除非使用 `--no-brute`,否则将自动追加内置的常用密码(33 条)。
2. **破解引擎** — 如果密码数 ≤100,则按顺序运行。如果 >100,则使用带有 `cpu_count - 1` 个 worker 的 `multiprocessing.Pool`,通过 `imap_unordered` 进行并行破解。
3. **解密** — 使用 `pypdf.PdfReader.decrypt()` 测试每个密码。
4. **提取** — 一旦解锁,即可使用 `pypdf.extract_text()` 从每一页中提取文本。
5. **输出** — 以您选择的格式(文本/原始数据/JSON)打印到 stdout 或保存到文件中。
## 比较
| 工具 | 语言 | 多进程处理 | 字典 | 速率限制 | JSON 输出 | 元数据 | 进度条 |
|------|----------|:---------------:|:--------:|:----------:|:-----------:|:--------:|:------------:|
| **SPIDEY CRACK** | Python 3 | 是 | 是 | 是 | 是 | 是 | 是 |
| qpdf | C | 否 | 否 | 否 | 否 | 否 | 否 |
| pdfcrack | C | 否 | 是 | 否 | 否 | 否 | 否 |
| JohnTheRipper | C | 是 | 是 | 否 | 否 | 否 | 否 |
| PyPDF2 scripts | Python | 否 | 有限 | 否 | 否 | 否 | 否 |
| pdftotext | C | 否 | N/A | N/A | 否 | 否 | N/A |
**为什么选择 SPIDEY CRACK?**
- **内置密码列表** — 开箱即用,内置 33 个常用密码
- **多进程处理** — 利用所有 CPU 核心实现快速破解
- **丰富的输出** — 支持元数据的 JSON、原始数据、文本格式
- **用户友好** — 彩色输出,带有预计剩余时间 (ETA) 的进度条
- **轻量级** — 单一依赖项 (`pypdf`),无多余冗余
## 联系方式
## 免责声明
由 spidey 和 CryptoLuter 用 ❤️ 构建
© 2026 SPIDEY CRACK 团队
标签:AI合规, DOS头擦除, PDF处理, PoC, Python, SysWhispers, VEH, 字典攻击, 密码破解, 无后门, 暴力破解, 用户模式钩子绕过, 逆向工具