ipanalytics/vpn-provider-overlap-intelligence
GitHub: ipanalytics/vpn-provider-overlap-intelligence
一个公共聚合数据集,用于分析和揭示VPN提供商间的基础设施重叠关系。
Stars: 1 | Forks: 0
# VPN 提供商重叠情报
VPN 提供商重叠情报是一个公共聚合数据集,用于分析跨提供商、托管运营商、ASN 和网络范围的共享 VPN 基础设施模式。
该项目专注于从观察到的 VPN 网络足迹中提取基础设施重叠信号,包括精确的共享 IP 观测、共享 `/24` 前缀、托管集中度以及提供商关系聚类。
该仓库有意避免发布原始 VPN IP 清单。
## 概述
VPN 提供商通常依赖于重叠的基础设施生态系统:
* 共享的托管提供商
* 租赁的数据中心网络范围
* 转售平台
* 回收的地址池
* 常见的后端运营商
此仓库分析可观察到的重叠关系,并发布适用于以下用途的聚合信号:
* 欺诈检测
* VPN/代理研究
* 基础设施聚类
* IP 信誉增强
* 来源质量分析
* 风险特征工程
该项目专为分析和防御性工作流程设计,而非强制执行自动化。
## 证据模型
关系分析结合了多个独立的基础设施信号。
| 证据层 | 强度 | 描述 |
| --------------------- | -------: | ----------------------------------------------------- |
| 精确共享 IP | 强 | 同一 IP 在多个提供商身份下被观察到 |
| 共享 `/24` | 中等 | 提供商在同一小型网络块内重叠 |
| 共享 ASN | 上下文 | 提供商共享托管/运营商足迹 |
| 托管集中度 | 上下文 | 提供商对基础设施运营商的依赖 |
| 关系聚类 | 派生 | 跨提供商和网络的重复重叠 |
公开分数是启发式的、有界的。它并非所有权断言。
## 架构
```
VPN Infrastructure Sources
│
┌──────────────────┼──────────────────┐
│ │ │
▼ ▼ ▼
IP Observations ASN Enrichment Prefix Analysis
│ │ │
└──────────────────┴─────────┬────────┘
▼
Relationship Engine
exact IP /24 / ASN correlation
▼
Cluster Analysis
▼
CSV Exports
```
## 关键快照发现
### 强精确 IP 重叠聚类
```
Anonine, BoxPN, EasyHideIP, Froot, FrootVPN
```
此聚类显示了跨多个 ASN 和网络范围的重复精确 IP 重叠。
该信号表明了强有力的基础设施关系证据,但不应解释为确定的所有权归属。
## 顶级提供商对
| 提供商 A | 提供商 B | 得分 | 置信度 | 共享精确 IP | 共享 `/24` | 共享 ASN |
| ---------- | ------------- | ----: | ---------- | ---------------: | -----------: | ----------: |
| Anonine | BoxPN | 100 | 高 | 290 | 56 | 31 |
| Anonine | EasyHideIP | 100 | 高 | 285 | 55 | 30 |
| Anonine | FrootVPN | 100 | 高 | 285 | 55 | 30 |
| BoxPN | EasyHideIP | 100 | 高 | 285 | 55 | 30 |
| BoxPN | FrootVPN | 100 | 高 | 285 | 55 | 30 |
| EasyHideIP | FrootVPN | 100 | 高 | 285 | 55 | 30 |
| Ivacy | PureVPN | 79 | 高 | 27 | 20 | 9 |
| Getflix | Smartdnsproxy | 65 | 中等 | 18 | 18 | 15 |
| GhostPath | SlickVPN | 56 | 中等 | 11 | 11 | 10 |
## 顶级托管足迹
| 托管组织 | VPN IP 数量 | 提供商数量 | 示例提供商 |
| -------------------- | ------: | --------: | ------------------------------ |
| CDNEXT | 5,282 | 21 | NordVPN, CyberGhost, ProtonVPN |
| M247 | 4,709 | 50 | NordVPN, AirVPN, ProtonVPN |
| NETPROTECT-62651 | 3,190 | 3 | WLVPN, IPVanish, StrongVPN |
| CLOUVIDER | 2,844 | 10 | NordVPN, Astrill, IPVanish |
| PACKETHUBSA-AS-AP | 2,186 | 1 | NordVPN |
## 已发布数据集
| 文件 | 描述 |
| ------------------------------------ | ------------------------------------------------ |
| `provider_pair_exact_overlap.csv` | 提供商重叠关系得分 |
| `provider_relationship_clusters.csv` | 多提供商重叠聚类 |
| `shared_prefix_examples.csv` | 不泄露原始 IP 的 `/24` 重叠示例 |
| `provider_hosting_dependency.csv` | 每个提供商的托管集中度 |
| `hosting_company_footprint.csv` | 托管足迹排名 |
| `provider_independence_score.csv` | 基础设施集中度指标 |
## 关系评分
评分模型结合了:
* 精确共享 IP 计数
* 共享 `/24` 计数
* 共享 ASN 计数
### 置信度等级
| 置信度 | 含义 |
| ---------- | ------------------------------------ |
| `高` | 重复的强精确 IP 重叠 |
| `中等` | 需要上下文的有意义重叠 |
| `低` | 弱或稀疏的重叠信号 |
评分旨在用于分析加权,而非二元分类。
## 使用示例
### 下载重叠分数
```
curl -fsSLO \
https://raw.githubusercontent.com/ipanalytics/vpn-provider-overlap-intelligence/main/data/provider_pair_exact_overlap.csv
```
### 提取高置信度提供商对
```
awk -F, '$4 == "high" { print }' \
provider_pair_exact_overlap.csv
```
### 查找基础设施聚类
```
grep -i "NordVPN" \
provider_relationship_clusters.csv
```
### 分析托管集中度
```
sort -t, -k2 -nr \
hosting_company_footprint.csv | head
```
## 操作用例
| 领域 | 示例 |
| ---------------- | ------------------------------------ |
| 欺诈检测 | VPN 基础设施关联 |
| SIEM 增强 | 提供商关系上下文 |
| 威胁狩猎 | 共享托管分析 |
| 研究 | VPN 生态系统映射 |
| 滥用预防 | 基础设施集中度信号 |
| 分析 | 托管依赖性分析 |
## 安全解读
仅基础设施重叠并不意味着:
* 共同所有权
* 提供商遭入侵
* 恶意活动
* 运营协调
共享基础设施可能源于:
* 转售平台
* 数据中心复用
* 租赁地址池
* 提供商迁移
* 陈旧的上游数据集
* 白标 VPN 生态系统
数据集应视为上下文基础设施信号。
## 方法学
更多方法学细节:
```
docs/methodology.md
```
安全解读指南:
```
docs/safe_interpretation.md
```
## 设计目标
* 仅发布聚合数据
* 以基础设施为中心的分析
* 不披露原始 VPN 端点
* 轻量级 CSV 导出
* 可重复的重叠分析
* 操作安全的增强信号
## 非预期用途
该项目不适用于:
* ASN 范围封锁
* 所有权归属认定
* 法律/合规结论
* 独立 VPN 检测
* 无附加遥测的自动强制执行
## 仓库布局
```
.
├── data/
├── docs/
├── scripts/
├── LICENSE
└── README.md
```
## 路线图
计划增加:
* 时间重叠分析
| ASN 历史趋势
* IPv6 重叠支持
* 置信度加权改进
* 提供商别名规范化
* 基础设施沿袭追踪
## 许可证
根据 CC BY-NC 4.0 授权。
详见 [`LICENSE`](./LICENSE)。
## 免责声明
此仓库发布从观察到的 VPN 网络模式中派生的聚合基础设施重叠信号。数据集旨在用于分析、运营和防御性研究工作流程,不应视为确定的归属证据。
标签:ASN分析, BSD, IP地址分析, VPN分析, 代理研究, 信誉分析, 公开数据集, 共享前缀, 基础设施分析, 托管依赖, 提供商关系, 数据挖掘, 欺诈检测, 流量捕获, 网络安全, 网络拓扑, 聚类分析, 防御工作流, 隐私保护, 风险特征工程