ever-just/company-dossier-vscode
GitHub: ever-just/company-dossier-vscode
一款 VS Code 扩展,输入公司网址即可自动采集网站、DNS、技术栈及公开记录,生成结构化的竞争情报档案。
Stars: 0 | Forks: 0
# Company Dossier — 情报研究
[](https://marketplace.visualstudio.com/items?itemName=EVERJUSTs.company-dossier)
[](https://marketplace.visualstudio.com/items?itemName=EVERJUSTs.company-dossier)
[](./LICENSE)
将任何公司 URL 转化为结构化的竞争情报档案 —— 无需离开 VS Code。Company Dossier 会爬取实时网站,从 Wayback Machine 还原其历史记录,对 DNS/邮件基础架构和技术栈进行指纹识别,提取公开记录,并(可选)使用 Claude 将执行摘要、SWOT 和关键发现整合为一个可导航、对 agent 友好的 markdown 文件夹。
## 功能
- **单一输入研究** —— 只需提供公司名称 + URL,即可获得完整的档案。
- **实时网站爬取** —— 主页、sitemap 以及多达 50 个优先级页面(关于、团队、产品、定价、联系方式、新闻)。
- **Wayback 历史** —— 多查询 CDX 侦察:总捕获量、独立 URL、存档的 PDF 以及已删除的页面。
- **DNS 与邮件侦察** —— MX 提供商、SPF、DMARC、子域名、验证 token。
- **技术栈检测** —— CMS、框架、CDN、分析 ID、GTM 和广告 pixel。
- **公开记录** —— USASpending 联邦合同和发现的社交媒体资料。
- **AI 综合(可选)** —— 执行摘要、SWOT、排名发现以及“需要手动研究”的内容,所有内容均以收集到的证据为基础(需要 Anthropic API key)。
- **结构化输出** —— 包含 12 个部分的档案,带有 YAML frontmatter、`_MOC.md` 内容地图以及 `ROUTER.md`,以便 AI agent 可以通过两次读取完成导航。
- **仅限公开数据** —— 无需登录,不进行身份验证后的抓取。
## 安装说明
**从 Marketplace 安装**
1. 打开 VS Code → 扩展 (`Ctrl/Cmd+Shift+X`)。
2. 搜索 **Company Dossier — Intelligence Research**。
3. 点击 **Install**。或者[在 Marketplace 上打开它](https://marketplace.visualstudio.com/items?itemName=EVERJUSTs.company-dossier)。
**从源码安装**
```
git clone https://github.com/ever-just/company-dossier-vscode
cd company-dossier-vscode
npm install
npm run compile
```
然后在 VS Code 中按 `F5` 启动扩展开发宿主,或者使用 `npx vsce package` 打包成 `.vsix`,并通过扩展 → “Install from VSIX…” 进行安装。
## 用法
首先在 VS Code 中打开一个文件夹 —— 档案将写入到打开的工作区中。
- **侧边栏视图** —— 点击活动栏中的 Company Dossier 图标,输入公司名称 + URL,并查看实时进度以运行研究 pipeline。
- **Chat 参与者** —— 在 Chat 视图 (Copilot Chat) 中,输入:
@dossier /research Acme Corp https://acme.com
结果会以流式方式内联返回,并提供一个用于打开生成的档案的按钮。
- **命令面板** (`Ctrl/Cmd+Shift+P`):
- **Dossier: Research Company** —— 提示输入名称 + URL,然后运行完整的 pipeline。
- **Dossier: New Entity Profile** —— 将一个资料(人员、供应商、竞争对手、客户、产品)构建到相应的部分中。
**可选的 AI 综合:** 在 Settings → **Company Dossier → Anthropic API Key** (`companyDossier.anthropicApiKey`) 中添加你的 key。如果没有 key,数据仍会被收集和写入;仅会跳过 LLM 综合步骤。可以通过 `companyDossier.maxPages` 调整爬取深度。
## 输出
每次运行都会在你的工作区中创建一个 `" DOSSIER/"` 文件夹:
```
DOSSIER/
├── README.md ← Landing page
├── ROUTER.md ← AI-agent navigation (question → file)
├── CHANGELOG.md
├── _meta/ ← Methodology, confidence scale
├── _data/ ← Structured data (CSVs)
├── _assets/ ← Photos & PDFs
├── _evidence/ ← Raw source data
├── 1_corporate/ ← Identity, legal, certifications
├── 2_people/profiles/ ← One file per person
├── 3_products/ ← Products, services, pricing
├── 4_suppliers/profiles/ ← One file per supplier
├── 5_customers/ ← Clients, prospects
├── 6_competitors/profiles/← One file per competitor
├── 7_financials/ ← Revenue, valuation
├── 8_marketing/ ← Social, events, press
├── 9_brand/ ← Visual identity
├── 10_timeline/ ← History, milestones
├── 11_analysis/ ← Risk register, SWOT, theses
└── 12_industry/ ← Market context
```
每个文件都带有 YAML frontmatter(类型、置信度、最后更新时间)。如果提供了 API key,分析部分将填充执行摘要、SWOT、关键发现以及手动研究清单。
## 也可作为以下形式提供
Company Dossier 是更大生态系统的一部分:
- **网站** —— [companydossier.lol](https://companydossier.lol)
- **npm 包** —— [`company-dossier`](https://www.npmjs.com/package/company-dossier) —— 从终端运行它:
npx company-dossier
- **核心仓库与方法论** —— [github.com/ever-just/company-dossier](https://github.com/ever-just/company-dossier)
## 文档
- [架构](./docs/ARCHITECTURE.md) —— 收集器 → 生成器 → 侧边栏的工作流。
- [AGENTS.md](./AGENTS.md) —— AI agent 应如何理解和扩展此仓库。
- [贡献指南](./CONTRIBUTING.md) · [行为准则](./CODE_OF_CONDUCT.md) · [安全政策](./SECURITY.md) · [更新日志](./CHANGELOG.md)
## 许可证
[MIT](./LICENSE) © EverJust
标签:ESC4, MITM代理, OSINT, Web爬虫, 商业情报, 暗色界面, 竞品分析, 自动化攻击, 防御加固