champmq/TheScrapper
GitHub: champmq/TheScrapper
一款基于 Python 的轻量级网页抓取工具,用于从目标网站中提取电子邮件、电话号码和社交媒体账号等公开联系信息。
Stars: 315 | Forks: 58
# TheScrapper
TheScrapper 是一款多功能的网页抓取工具,旨在从网站中提取电子邮件、电话号码和社交媒体账号。你可以将收集到的信息用于各种目的,例如进一步研究或联系网站所有者。
## 安装与设置
要开始使用 TheScrapper,请按照以下简单的安装步骤操作:
1. 克隆仓库:
```
git clone https://github.com/champmq/TheScrapper.git
```
2. 切换目录:
```
cd TheScrapper
```
3. 安装所有依赖项:
```
pip3 install -r requirements.txt
```
## 使用方法
TheScrapper 提供了多种使用选项:
- 简单扫描:
```
python3 TheScrapper.py --url URL
```
- 扫描并抓取发现的 URL:
```
python3 TheScrapper.py --url URL --crawl
```
- 获取有关发现的社交媒体账号的更多信息:
```
python3 TheScrapper.py --url URL --social-extract
```
- 指定输出内容:
```
python3 TheScrapper.py --url URL -s # Social Media only
python3 TheScrapper.py --url URL -e -p # Emails + Numbers only
python3 TheScrapper.py --url URL # All output (default)
```
有关其他命令行参数和选项,请参阅帮助菜单:
```
python3 TheScrapper.py -h
```
要移除启动横幅,只需添加 "-b" 标志。
## 添加更多社交媒体网站
如果你想添加更多社交媒体网站进行抓取。你可以将它们追加到 `socials.txt` 文件中。如果你愿意与社区分享你的添加内容,欢迎提交 pull request。
## 已知问题
当使用已包含在 `socials.txt` 文件中的网站时,`--sm` 标志可能会产生不太有用的输出。为避免这种情况,请考虑排除此类 URL 或避免使用 `--sm` 标志。
### 许可证 - [GNU](LICENSE)
由 [champmq](https://github.com/champmq) 构建 — 另请查看 [CoSINT](https://github.com/champmq/cosint),一个由 AI 驱动的 OSINT 运行时。
标签:E-mail抓取, ESC4, OSINT, Python, Tarakhasiya, URL抓取, 个人隐私数据泄露, 信息搜集工具, 安全研发, 攻击路径可视化, 数据抓取, 无后门, 爬虫框架, 电子邮件提取, 电话号码提取, 目标侦察, 社交媒体收集, 网站扫描, 网络情报, 逆向工具, 黑客工具