ipanalytics/vpn-provider-overlap-intelligence

GitHub: ipanalytics/vpn-provider-overlap-intelligence

一个公共聚合数据集,用于分析和揭示VPN提供商间的基础设施重叠关系。

Stars: 1 | Forks: 0

# VPN 提供商重叠情报

License Last Commit Dataset Focus Exports

VPN 提供商重叠情报是一个公共聚合数据集,用于分析跨提供商、托管运营商、ASN 和网络范围的共享 VPN 基础设施模式。 该项目专注于从观察到的 VPN 网络足迹中提取基础设施重叠信号,包括精确的共享 IP 观测、共享 `/24` 前缀、托管集中度以及提供商关系聚类。 该仓库有意避免发布原始 VPN IP 清单。 ## 概述 VPN 提供商通常依赖于重叠的基础设施生态系统: * 共享的托管提供商 * 租赁的数据中心网络范围 * 转售平台 * 回收的地址池 * 常见的后端运营商 此仓库分析可观察到的重叠关系,并发布适用于以下用途的聚合信号: * 欺诈检测 * VPN/代理研究 * 基础设施聚类 * IP 信誉增强 * 来源质量分析 * 风险特征工程 该项目专为分析和防御性工作流程设计,而非强制执行自动化。 ## 证据模型 关系分析结合了多个独立的基础设施信号。 | 证据层 | 强度 | 描述 | | --------------------- | -------: | ----------------------------------------------------- | | 精确共享 IP | 强 | 同一 IP 在多个提供商身份下被观察到 | | 共享 `/24` | 中等 | 提供商在同一小型网络块内重叠 | | 共享 ASN | 上下文 | 提供商共享托管/运营商足迹 | | 托管集中度 | 上下文 | 提供商对基础设施运营商的依赖 | | 关系聚类 | 派生 | 跨提供商和网络的重复重叠 | 公开分数是启发式的、有界的。它并非所有权断言。 ## 架构 ``` VPN Infrastructure Sources │ ┌──────────────────┼──────────────────┐ │ │ │ ▼ ▼ ▼ IP Observations ASN Enrichment Prefix Analysis │ │ │ └──────────────────┴─────────┬────────┘ ▼ Relationship Engine exact IP /24 / ASN correlation ▼ Cluster Analysis ▼ CSV Exports ``` ## 关键快照发现 ### 强精确 IP 重叠聚类 ``` Anonine, BoxPN, EasyHideIP, Froot, FrootVPN ``` 此聚类显示了跨多个 ASN 和网络范围的重复精确 IP 重叠。 该信号表明了强有力的基础设施关系证据,但不应解释为确定的所有权归属。 ## 顶级提供商对 | 提供商 A | 提供商 B | 得分 | 置信度 | 共享精确 IP | 共享 `/24` | 共享 ASN | | ---------- | ------------- | ----: | ---------- | ---------------: | -----------: | ----------: | | Anonine | BoxPN | 100 | 高 | 290 | 56 | 31 | | Anonine | EasyHideIP | 100 | 高 | 285 | 55 | 30 | | Anonine | FrootVPN | 100 | 高 | 285 | 55 | 30 | | BoxPN | EasyHideIP | 100 | 高 | 285 | 55 | 30 | | BoxPN | FrootVPN | 100 | 高 | 285 | 55 | 30 | | EasyHideIP | FrootVPN | 100 | 高 | 285 | 55 | 30 | | Ivacy | PureVPN | 79 | 高 | 27 | 20 | 9 | | Getflix | Smartdnsproxy | 65 | 中等 | 18 | 18 | 15 | | GhostPath | SlickVPN | 56 | 中等 | 11 | 11 | 10 | ## 顶级托管足迹 | 托管组织 | VPN IP 数量 | 提供商数量 | 示例提供商 | | -------------------- | ------: | --------: | ------------------------------ | | CDNEXT | 5,282 | 21 | NordVPN, CyberGhost, ProtonVPN | | M247 | 4,709 | 50 | NordVPN, AirVPN, ProtonVPN | | NETPROTECT-62651 | 3,190 | 3 | WLVPN, IPVanish, StrongVPN | | CLOUVIDER | 2,844 | 10 | NordVPN, Astrill, IPVanish | | PACKETHUBSA-AS-AP | 2,186 | 1 | NordVPN | ## 已发布数据集 | 文件 | 描述 | | ------------------------------------ | ------------------------------------------------ | | `provider_pair_exact_overlap.csv` | 提供商重叠关系得分 | | `provider_relationship_clusters.csv` | 多提供商重叠聚类 | | `shared_prefix_examples.csv` | 不泄露原始 IP 的 `/24` 重叠示例 | | `provider_hosting_dependency.csv` | 每个提供商的托管集中度 | | `hosting_company_footprint.csv` | 托管足迹排名 | | `provider_independence_score.csv` | 基础设施集中度指标 | ## 关系评分 评分模型结合了: * 精确共享 IP 计数 * 共享 `/24` 计数 * 共享 ASN 计数 ### 置信度等级 | 置信度 | 含义 | | ---------- | ------------------------------------ | | `高` | 重复的强精确 IP 重叠 | | `中等` | 需要上下文的有意义重叠 | | `低` | 弱或稀疏的重叠信号 | 评分旨在用于分析加权,而非二元分类。 ## 使用示例 ### 下载重叠分数 ``` curl -fsSLO \ https://raw.githubusercontent.com/ipanalytics/vpn-provider-overlap-intelligence/main/data/provider_pair_exact_overlap.csv ``` ### 提取高置信度提供商对 ``` awk -F, '$4 == "high" { print }' \ provider_pair_exact_overlap.csv ``` ### 查找基础设施聚类 ``` grep -i "NordVPN" \ provider_relationship_clusters.csv ``` ### 分析托管集中度 ``` sort -t, -k2 -nr \ hosting_company_footprint.csv | head ``` ## 操作用例 | 领域 | 示例 | | ---------------- | ------------------------------------ | | 欺诈检测 | VPN 基础设施关联 | | SIEM 增强 | 提供商关系上下文 | | 威胁狩猎 | 共享托管分析 | | 研究 | VPN 生态系统映射 | | 滥用预防 | 基础设施集中度信号 | | 分析 | 托管依赖性分析 | ## 安全解读 仅基础设施重叠并不意味着: * 共同所有权 * 提供商遭入侵 * 恶意活动 * 运营协调 共享基础设施可能源于: * 转售平台 * 数据中心复用 * 租赁地址池 * 提供商迁移 * 陈旧的上游数据集 * 白标 VPN 生态系统 数据集应视为上下文基础设施信号。 ## 方法学 更多方法学细节: ``` docs/methodology.md ``` 安全解读指南: ``` docs/safe_interpretation.md ``` ## 设计目标 * 仅发布聚合数据 * 以基础设施为中心的分析 * 不披露原始 VPN 端点 * 轻量级 CSV 导出 * 可重复的重叠分析 * 操作安全的增强信号 ## 非预期用途 该项目不适用于: * ASN 范围封锁 * 所有权归属认定 * 法律/合规结论 * 独立 VPN 检测 * 无附加遥测的自动强制执行 ## 仓库布局 ``` . ├── data/ ├── docs/ ├── scripts/ ├── LICENSE └── README.md ``` ## 路线图 计划增加: * 时间重叠分析 | ASN 历史趋势 * IPv6 重叠支持 * 置信度加权改进 * 提供商别名规范化 * 基础设施沿袭追踪 ## 许可证 根据 CC BY-NC 4.0 授权。 详见 [`LICENSE`](./LICENSE)。 ## 免责声明 此仓库发布从观察到的 VPN 网络模式中派生的聚合基础设施重叠信号。数据集旨在用于分析、运营和防御性研究工作流程,不应视为确定的归属证据。
标签:ASN分析, BSD, IP地址分析, VPN分析, 代理研究, 信誉分析, 公开数据集, 共享前缀, 基础设施分析, 托管依赖, 提供商关系, 数据挖掘, 欺诈检测, 流量捕获, 网络安全, 网络拓扑, 聚类分析, 防御工作流, 隐私保护, 风险特征工程