ever-just/company-dossier-vscode

GitHub: ever-just/company-dossier-vscode

一款 VS Code 扩展,输入公司网址即可自动采集网站、DNS、技术栈及公开记录,生成结构化的竞争情报档案。

Stars: 0 | Forks: 0

# Company Dossier — 情报研究 [![VS Code Marketplace](https://img.shields.io/visual-studio-marketplace/v/EVERJUSTs.company-dossier?label=VS%20Code%20Marketplace&color=0d1117)](https://marketplace.visualstudio.com/items?itemName=EVERJUSTs.company-dossier) [![安装量](https://img.shields.io/visual-studio-marketplace/i/EVERJUSTs.company-dossier?color=0d1117)](https://marketplace.visualstudio.com/items?itemName=EVERJUSTs.company-dossier) [![许可证: MIT](https://img.shields.io/badge/License-MIT-blue.svg)](./LICENSE) 将任何公司 URL 转化为结构化的竞争情报档案 —— 无需离开 VS Code。Company Dossier 会爬取实时网站,从 Wayback Machine 还原其历史记录,对 DNS/邮件基础架构和技术栈进行指纹识别,提取公开记录,并(可选)使用 Claude 将执行摘要、SWOT 和关键发现整合为一个可导航、对 agent 友好的 markdown 文件夹。 ## 功能 - **单一输入研究** —— 只需提供公司名称 + URL,即可获得完整的档案。 - **实时网站爬取** —— 主页、sitemap 以及多达 50 个优先级页面(关于、团队、产品、定价、联系方式、新闻)。 - **Wayback 历史** —— 多查询 CDX 侦察:总捕获量、独立 URL、存档的 PDF 以及已删除的页面。 - **DNS 与邮件侦察** —— MX 提供商、SPF、DMARC、子域名、验证 token。 - **技术栈检测** —— CMS、框架、CDN、分析 ID、GTM 和广告 pixel。 - **公开记录** —— USASpending 联邦合同和发现的社交媒体资料。 - **AI 综合(可选)** —— 执行摘要、SWOT、排名发现以及“需要手动研究”的内容,所有内容均以收集到的证据为基础(需要 Anthropic API key)。 - **结构化输出** —— 包含 12 个部分的档案,带有 YAML frontmatter、`_MOC.md` 内容地图以及 `ROUTER.md`,以便 AI agent 可以通过两次读取完成导航。 - **仅限公开数据** —— 无需登录,不进行身份验证后的抓取。 ## 安装说明 **从 Marketplace 安装** 1. 打开 VS Code → 扩展 (`Ctrl/Cmd+Shift+X`)。 2. 搜索 **Company Dossier — Intelligence Research**。 3. 点击 **Install**。或者[在 Marketplace 上打开它](https://marketplace.visualstudio.com/items?itemName=EVERJUSTs.company-dossier)。 **从源码安装** ``` git clone https://github.com/ever-just/company-dossier-vscode cd company-dossier-vscode npm install npm run compile ``` 然后在 VS Code 中按 `F5` 启动扩展开发宿主,或者使用 `npx vsce package` 打包成 `.vsix`,并通过扩展 → “Install from VSIX…” 进行安装。 ## 用法 首先在 VS Code 中打开一个文件夹 —— 档案将写入到打开的工作区中。 - **侧边栏视图** —— 点击活动栏中的 Company Dossier 图标,输入公司名称 + URL,并查看实时进度以运行研究 pipeline。 - **Chat 参与者** —— 在 Chat 视图 (Copilot Chat) 中,输入: @dossier /research Acme Corp https://acme.com 结果会以流式方式内联返回,并提供一个用于打开生成的档案的按钮。 - **命令面板** (`Ctrl/Cmd+Shift+P`): - **Dossier: Research Company** —— 提示输入名称 + URL,然后运行完整的 pipeline。 - **Dossier: New Entity Profile** —— 将一个资料(人员、供应商、竞争对手、客户、产品)构建到相应的部分中。 **可选的 AI 综合:** 在 Settings → **Company Dossier → Anthropic API Key** (`companyDossier.anthropicApiKey`) 中添加你的 key。如果没有 key,数据仍会被收集和写入;仅会跳过 LLM 综合步骤。可以通过 `companyDossier.maxPages` 调整爬取深度。 ## 输出 每次运行都会在你的工作区中创建一个 `" DOSSIER/"` 文件夹: ``` DOSSIER/ ├── README.md ← Landing page ├── ROUTER.md ← AI-agent navigation (question → file) ├── CHANGELOG.md ├── _meta/ ← Methodology, confidence scale ├── _data/ ← Structured data (CSVs) ├── _assets/ ← Photos & PDFs ├── _evidence/ ← Raw source data ├── 1_corporate/ ← Identity, legal, certifications ├── 2_people/profiles/ ← One file per person ├── 3_products/ ← Products, services, pricing ├── 4_suppliers/profiles/ ← One file per supplier ├── 5_customers/ ← Clients, prospects ├── 6_competitors/profiles/← One file per competitor ├── 7_financials/ ← Revenue, valuation ├── 8_marketing/ ← Social, events, press ├── 9_brand/ ← Visual identity ├── 10_timeline/ ← History, milestones ├── 11_analysis/ ← Risk register, SWOT, theses └── 12_industry/ ← Market context ``` 每个文件都带有 YAML frontmatter(类型、置信度、最后更新时间)。如果提供了 API key,分析部分将填充执行摘要、SWOT、关键发现以及手动研究清单。 ## 也可作为以下形式提供 Company Dossier 是更大生态系统的一部分: - **网站** —— [companydossier.lol](https://companydossier.lol) - **npm 包** —— [`company-dossier`](https://www.npmjs.com/package/company-dossier) —— 从终端运行它: npx company-dossier - **核心仓库与方法论** —— [github.com/ever-just/company-dossier](https://github.com/ever-just/company-dossier) ## 文档 - [架构](./docs/ARCHITECTURE.md) —— 收集器 → 生成器 → 侧边栏的工作流。 - [AGENTS.md](./AGENTS.md) —— AI agent 应如何理解和扩展此仓库。 - [贡献指南](./CONTRIBUTING.md) · [行为准则](./CODE_OF_CONDUCT.md) · [安全政策](./SECURITY.md) · [更新日志](./CHANGELOG.md) ## 许可证 [MIT](./LICENSE) © EverJust
标签:ESC4, MITM代理, OSINT, Web爬虫, 商业情报, 暗色界面, 竞品分析, 自动化攻击, 防御加固