sho-luv/spider

GitHub: sho-luv/spider

Spider 是一款基于 headless Chromium 的 JS 感知爬虫,通过渲染页面并捕获网络流量来全面映射目标的 Web 攻击面。

Stars: 0 | Forks: 0

# spider

Spider — Web Crawler & Mapper

一款用于安全侦察的感知 JS 的 Web 爬虫。它会在 **headless Chromium 中渲染每一个页面**,因此无论网站是如何构建的——服务端渲染的 HTML、React/Vue/Angular SPA、懒加载路由,还是 JS 注入的链接,它都能看到内容。在每个页面渲染时,它还会**捕获网络流量**,从而显示出普通的 HTML 解析器永远无法看到的 XHR/`fetch` API endpoint。 其目标是全面展示目标的攻击面:每一个 URL、endpoint、表单、parameter、脚本和链接——无论是内部还是外部的。 ## 捕获内容 - **页面** — URL、HTTP 状态码、重定向后的最终 URL、content-type、标题、深度,以及发现该页面的来源页面。 - **Endpoint** — 渲染时发出的真实请求(文档、XHR、`fetch`、脚本、图像等),加上从内联 JS 和 HTML 中*推断*出的 URL/路径。每个 endpoint 都会记录观察到的 HTTP 方法和资源类型,以及是否在范围内。 - **表单与 parameter** — 每个表单的 action、method,以及输入名称/类型(parameter 攻击面)。 - **脚本** — 加载的外部 `