Vitalcheffe/Nexus-Osint
GitHub: Vitalcheffe/Nexus-Osint
开源实时地理空间情报平台,聚合35+数据源并通过六维关联评分过滤噪音,只呈现经过多源验证的可信事件。
Stars: 1 | Forks: 0
# NEXUS Intelligence 平台




## 我为什么构建这个项目
我过去常在深夜和妈妈一起观看半岛电视台——她会为我翻译阿拉伯语部分。与此同时,我会泡在 Telegram 上,从 OSINT 频道拉取视频并实时展示给她看。
有一天晚上,我给她看了一个视频。十分钟后,她向我展示了同一段片段——刚刚发布在 Instagram 上。我比主流社交媒体早十分钟拥有它,甚至在这些内容存在之前。
这引发了我的思考。信息究竟源自何处?谁最先掌握它?如何辨别真伪?
后来她给我看了一段视频,声称哈梅内伊在掩体袭击中丧生。非常逼真。但这不仅错误——而且该镜头是在城市中部拍摄的,背景中可见公寓楼。没人发现这一点,因为视频传播得太快,每个人都在转发,而不是在观察。
这才是真正的问题。不在于寻找信息,而在于懂得如何处理它。
## 它的功能
它同时从 35+ 个开源数据源拉取数据:卫星火灾探测、地震传感器、ADS-B 航空应答机、AIS 船舶追踪、GPS 干扰地图、GDELT 新闻档案、Wikipedia 编辑速度(发生突发事件时 Wikipedia 编辑会很快——这是一个比听起来更好的早期预警信号)、来自 Cloudflare Radar 和 NetBlocks 的互联网中断检测、经济异常检测、来自 Sentinel-1 和 Sentinel-2 的 SAR 图像。
每一个进入系统的信号在显示到屏幕上之前都会经过关联处理。核心理念是:一个信号是噪声,两个是巧合,三个独立信源在紧凑的时间窗口内确认同一地点的同一事件才可能是真实的。引擎跨六个维度计算得分:
```
total = spatial×0.18 + temporal×0.16 + semantic×0.18
+ behavioral×0.14 + historical×0.14
+ source_diversity×0.12 + confidence×0.08
```
空间维度使用信号簇质心的 Haversine 距离——超过 500km 后降至零。时间维度是信号间时间窗口的紧凑程度——3 分钟内权重最大,3 小时后归零。语义维度使用带有同义词扩展的 tokenized 描述之间的 Jaccard 相似度。信源多样性计算唯一的独立数据源——如果一个信号同时被 GDELT、AIS、Telegram 和 USGS 确认,得分接近 1.0。
只有当总分超过阈值时,地球上才会显示内容。大多数时候地球是完全静默的。当有内容出现时,意味着多个独立系统在几分钟内报告了同一件事。
## Telegram 层
92 个频道,每个都有可信度得分。该得分基于三点:该频道率先报道某事并随后得到确认的频率、包含可验证坐标的频率,以及其造假的历史记录。
像 @iswnews 这样的频道得分是 83。国家宣传机构的得分是 15,其发布的所有内容都会相应被降权。一个拥有长期准确且快速记录的频道,即使只有 3,000 名关注者也会被认真对待。一个拥有 80 万关注者但只是迟 6 分钟转发路透社的扩音器账号则价值不大。
这些频道被组织成集群:西方分析机构、中立聚合器、西班牙语地缘政治(西班牙语圈有一个出奇强大的 OSINT 社区)、数据可视化,以及——因为智识诚实很重要——极右翼极端主义账号,它们受到最大的可信度惩罚,但仍被监控,因为即使是恶意行为者有时也会率先报道真实事件。
一个使用 Telethon 的 Python 后端并行监控所有 92 个频道。帖子被标记、评分、在可能的情况下进行地理定位,并作为 `TelegramSignal` 对象推送到 SSE 流中。
## Matrix 标签页
其中一个标签页是一个 9×11 的热力图——九个活跃区域(霍尔木兹、加沙、基辅、红海、台湾、伊斯法罕、平壤、莫斯科、斯普拉特利群岛)对阵十一个信源类别。每个单元格显示该信源在过去 6 小时内为该区域生成的活动量。你可以一目了然地看到哪些区域正在升温,以及哪些信源在推动它。霍尔木兹海峡在 AIS、GDELT、Telegram 和 NOTAM 上同时亮起,与其仅在 Telegram 上亮起是完全不同的情况。
## 暗网层
一个独立的 Python 脚本处理明网和 Tor 可访问源:4chan /pol/ 和 /k/(虽然杂乱,但在冲突报道方面确实非常快)、OSINT subreddits、Bellingcat、通过 .onion 镜像访问的调查媒体,以及为威胁情报监控的勒索软件泄露站点。所有内容都通过 Tor SOCKS5 代理,并以与明网信号相同的 SSE 流到达,标记为 `onion: true` 或 `false`。
## 科学层
文本分析基于已发表的研究。每个信号描述都通过以下方式评分:
- **LDA 主题建模** (Mueller & Rauh, APSR 2018) —— 提取底层主题分布以改进语义匹配
- **速度惩罚** (Vosoughi et al., MIT/Science 2018) —— 相对于其内容类型,对传播异常快的信号进行降权,这是一个可靠的虚假信息指标
- **ViEWS 校准** (PRIO Oslo 2024) —— 将事件计数和得分阈值映射到按国家划分的冲突升级概率
- **CUSUM 异常检测** (序列变点分析) —— 实时标记各区域信号量的统计异常
- **CIB 检测** (Harvard Shorenstein 2024) —— 对 Telegram 频道间的协同虚假行为模式进行评分
- **Sentinel SAR 评分器** (ETH CSS 2024) —— 针对 7 个活跃区域,根据基线卫星图像评估合成孔径雷达异常
这些都不是装饰性的。它们被接入评分流水线,并影响屏幕上显示的内容。
## 运行
```
git clone https://github.com/Vitalcheffe/nexus-osint
cd nexus-platform
npm install
npm run dev
```
大多数信源无需任何密钥即可工作——GDELT、USGS 地震、Wikipedia、ADSB.fi、GPSJam、UN ReliefWeb。真实的实时数据,立即可用。免费注册可解锁其余部分:用于冲突事件的 ACLED、用于火灾探测的 NASA FIRMS、用于互联网中断的 Cloudflare Radar、用于海事信息的 AISstream。
将 `.env.example` 复制到 `.env.local` 并填入你拥有的密钥。未配置的信源将保持静默——没有虚假数据,没有占位符信号。
对于 Telegram 收集器:
```
pip install telethon httpx beautifulsoup4
export TELEGRAM_API_ID=...
export TELEGRAM_API_HASH=...
python3 scripts/nexus_telegram_collector.py
```
对于暗网收集器,需要在端口 9050 上运行 Tor:
```
tor &
python3 scripts/nexus_darkweb_collector.py
```
还有一个轻量版本(`nexus_replit_collector.py`),完全跳过 Tor 并可在任何免费主机上运行。部署运行在 Render.com 免费层——仓库中已包含 `render.yaml`。UptimeRobot 每 5 分钟 ping 一次 `/api/health` 以保持其唤醒。总基础设施成本:零。
## 背景
我 16 岁。我构建这个项目是因为我对一个真实的问题感到真实的沮丧,而不是因为这看起来像是一个值得炫耀的构建物。
大多数有趣的决定不在于添加功能——而在于决定*不*显示什么。地球大部分时间是静默的,这是刻意为之。单个信号毫无意义。重点在于有足够的定力等待趋同。
有些部分仍然粗糙。科学层已接入,但可以针对基本事实进行更仔细的校准。这是一个真实的项目,不是作品集作品——这意味着它未完成,就像真实的事物总是未完成的一样。
如果你在这个领域工作——地理空间情报、实时数据聚合、冲突监控——欢迎开启一个 issue 或联系我。
基于 [WorldWideView](https://github.com/silvertakana/worldwideview) 由 silvertakana 构建。许可证:MPL-2.0。
*参考文献:Mueller & Rauh (2018) APSR · Vosoughi et al. (2018) Science · PRIO ViEWS (2024) · ETH CSS (2024) · Harvard Shorenstein (2024) · Haversine formula (Sinnott, 1984)*
标签:3D 地球, ADS-B 航空追踪, AIS 船舶追踪, CesiumJS, ESC4, ESC8, GDELT, GEOINT, HTTP/HTTPS抓包, OSINT, Telegram 监控, TypeScript, 互联网中断检测, 信号处理, 假新闻检测, 卫星图像, 地理空间情报, 地缘政治, 多源关联, 安全插件, 实时处理, 密码管理, 态势感知, 情报分析, 数据融合, 社会工程学, 维基百科监控, 网络安全, 网络诊断, 自动化攻击, 虚假信息, 逆向工具, 隐私保护, 风险情报