dvlinuxx-max/dirseek
GitHub: dvlinuxx-max/dirseek
dirseek 是一款基于字典的 Web 路径发现工具,通过 soft-404 过滤机制精准识别服务器上实际存在的目录与文件。
Stars: 0 | Forks: 0
# dirseek
基于字典的 Web 服务器内容与路径发现工具。针对基础 URL 请求每个条目,通过与随机路径的基准进行比较来过滤 soft-404,并报告实际存在的路径。仅使用标准库,无任何依赖。
## 用法
```
python dirseek.py [options]
```
```
python dirseek.py https://example.com
python dirseek.py https://example.com -w wordlist.txt -x php,bak,old
python dirseek.py https://example.com -s 200,301 -t 50
python dirseek.py https://example.com --json > results.json
```
如果不使用 `-w` 参数,将使用内置的常见管理路径、备份、配置文件和框架端点列表。
## 选项
```
-w, --wordlist wordlist file (one entry per line; # comments allowed)
-x, --extensions comma-separated extensions to append, e.g. php,bak,old
-t, --threads concurrent requests (default: 30)
--timeout per-request timeout in seconds (default: 6.0)
-m, --method GET | HEAD (default: GET)
-s, --status only show these status codes, e.g. 200,301,403
--hide hide these status codes (default: 404)
--follow follow redirects
--json machine-readable output
--no-color disable ANSI colors
```
## Soft-404 处理
许多服务器对于不存在的路径也会返回 `200 OK`。在扫描之前,dirseek 会请求两个随机路径以获取“未找到”响应体的大小,随后会丢弃与之匹配的 `200` 响应。如果站点对未知路径提供差异化的页面(例如,每个用户名对应一个个人资料页),则无法通过这种方式进行过滤,并将显示为已找到。
## 授权
仅允许对您拥有或被明确授权测试的服务器运行。内容发现会产生大量请求,并在访问日志中清晰可见。
## 许可证
MIT
标签:Python, Web安全, 动态分析, 大数据, 无后门, 目录扫描, 蓝队分析, 逆向工具