0ggp4r1s/osint-pattern-analyzer
GitHub: 0ggp4r1s/osint-pattern-analyzer
一款专注于跨平台身份关联与模式检测的自动化 OSINT 工具,解决从电话号码与用户名中高效提取并结构化线索的问题。
Stars: 9 | Forks: 0
# OSINT 模式分析器
用于跨多个身份向量(电话号码、用户名,未来支持电子邮件)进行 OSINT 调查自动化的工具,旨在提取结构化数据并实现模式检测与关联分析。
## 功能
### 电话号码 OSINT
- 跨多个平台搜索电话号码
- 支持多种电话号码格式(+34、0034、带空格变体)
- 自定义搜索查询(陪同相关、特定域)
- 广告类型检测:
- `individual`(个人)
- `group`(群组)
- `duo`(双人)
- 电话存在性验证(`phone_match`)
- 置信度分类系统:
- `high` → 确认的电话匹配,信号强
- `medium` → 部分匹配或上下文相关
- `low` → 可能是噪声或通用列表
### 用户名 OSINT
- 跨多个平台搜索用户名:
- 社交媒体
- 即时通讯平台
- 陪同平台
- 论坛
- 成人内容平台
- 平台分类:
- `telegram`(电报)
- `social`(社交)
- `dating`(约会)
- `sugar`
- `adult_creator`(成人创作者)
- `escort_sites`(陪同网站)
- `forums`(论坛)
- 噪声过滤(过滤通用页面)
- 检测类似个人资料链接
- 平台存在性汇总(✔ / ✘)
### 通用功能
- 使用 `ddgs` 获取更可靠的搜索结果
- JSON 结果导出
- 结果去重
- 为更高覆盖率生成多查询
- 评分系统以优先处理相关结果
- 专为关联与模式检测工作流设计
## 用法
### 电话号码搜索
```
python search_phone.py --phone 660XXXXXXX
```
### 用户名搜索
```
python search_username.py --username exampleuser
```
### 示例输出(电话号码)
```
[
{
"query": "\"660XXXXXX\"",
"title": "Example listing",
"link": "https://example.com/ad.html",
"domain": "example.com",
"type": "individual",
"score": 4,
"phone_match": true,
"confidence": "high"
}
]
```
### 示例输出(用户名)
```
{
"username": "exampleuser",
"platforms_detected": {
"telegram": false,
"social": true,
"dating": false,
"sugar": false,
"adult_creator": true,
"escort_sites": true,
"forums": true
},
"results": [
{
"title": "Example profile",
"link": "https://example.com/profile",
"categories": ["social"],
"score": 3
}
]
}
```
## 工作原理
### 1. 生成输入的多重变体
- 电话号码:
- 原始号码
- +34 格式
- 0034 格式
- 带空格格式
- 用户名:
- 直接查询
- 平台特定查询
### 2. 构建搜索查询:
- 通用查询
- 关键词增强查询(陪同、联系、按摩等)
- 特定域查询
### 3. 使用 DuckDuckGo(ddgs)获取结果
### 4. 应用过滤:
- 移除通用/分类页面
- 保留相关域名和类似个人资料链接
- 降低 SEO 噪声
### 5. 处理每个结果:
- 电话号码模块:
- 检测广告类型(个人 / 群组 / 双人)
- 检查标题/链接中是否存在电话号码
- 用户名模块:
- 检测平台类别
- 根据相关信号分配分数
### 6. 分类结果:
- 高 → 强匹配 + 良好结构
- 中 → 部分相关
- 低 → 弱或噪声结果
### 7. 输出结构化 JSON,便于分析
## 当前限制
- 结果依赖于搜索引擎行为
- 某些平台会引入 SEO 密集型噪声
- 检测仅基于标题/链接(不解析完整页面)
- 用户名检测是间接的(无 API 验证)
- 尚未实现自动关联或聚类
## 路线图
- 电子邮件 OSINT 模块
- 关联引擎(跨电话号码 / 用户名 / 电子邮件)
- 检测跨配置文件的复用身份
- 模式检测(机构 / 多账号行为)
- 导出为 CSV / Excel
- 可选的全页抓取以进行深度验证
- CLI 接口(工具风格用法)
## 说明
该项目是更广泛 OSINT 工作流的一部分,专注于数据关联而非简单数据收集。
目标是将原始搜索结果转换为结构化且可操作的智能数据,从而实现在多个平台间检测模式。
标签:DDGS, ESC4, Homebrew安装, JSON导出, OSINT, Telegram, 个人资料链接检测, 个体检测, 二人组检测, 噪声过滤, 平台分类, 平台存在性汇总, 成人内容平台, 成人创作者, 手机号码侦查, 护送平台, 搜索查询生成, 数据去重, 模式检测, 用户名侦查, 电话号码验证, 电话格式解析, 相关性评分, 社交平台, 糖友平台, 约会平台, 置信度分类, 群组检测, 论坛, 跨平台关联, 逆向工具