0ggp4r1s/osint-pattern-analyzer

GitHub: 0ggp4r1s/osint-pattern-analyzer

一款专注于跨平台身份关联与模式检测的自动化 OSINT 工具,解决从电话号码与用户名中高效提取并结构化线索的问题。

Stars: 9 | Forks: 0

# OSINT 模式分析器 用于跨多个身份向量(电话号码、用户名,未来支持电子邮件)进行 OSINT 调查自动化的工具,旨在提取结构化数据并实现模式检测与关联分析。 ## 功能 ### 电话号码 OSINT - 跨多个平台搜索电话号码 - 支持多种电话号码格式(+34、0034、带空格变体) - 自定义搜索查询(陪同相关、特定域) - 广告类型检测: - `individual`(个人) - `group`(群组) - `duo`(双人) - 电话存在性验证(`phone_match`) - 置信度分类系统: - `high` → 确认的电话匹配,信号强 - `medium` → 部分匹配或上下文相关 - `low` → 可能是噪声或通用列表 ### 用户名 OSINT - 跨多个平台搜索用户名: - 社交媒体 - 即时通讯平台 - 陪同平台 - 论坛 - 成人内容平台 - 平台分类: - `telegram`(电报) - `social`(社交) - `dating`(约会) - `sugar` - `adult_creator`(成人创作者) - `escort_sites`(陪同网站) - `forums`(论坛) - 噪声过滤(过滤通用页面) - 检测类似个人资料链接 - 平台存在性汇总(✔ / ✘) ### 通用功能 - 使用 `ddgs` 获取更可靠的搜索结果 - JSON 结果导出 - 结果去重 - 为更高覆盖率生成多查询 - 评分系统以优先处理相关结果 - 专为关联与模式检测工作流设计 ## 用法 ### 电话号码搜索 ``` python search_phone.py --phone 660XXXXXXX ``` ### 用户名搜索 ``` python search_username.py --username exampleuser ``` ### 示例输出(电话号码) ``` [ { "query": "\"660XXXXXX\"", "title": "Example listing", "link": "https://example.com/ad.html", "domain": "example.com", "type": "individual", "score": 4, "phone_match": true, "confidence": "high" } ] ``` ### 示例输出(用户名) ``` { "username": "exampleuser", "platforms_detected": { "telegram": false, "social": true, "dating": false, "sugar": false, "adult_creator": true, "escort_sites": true, "forums": true }, "results": [ { "title": "Example profile", "link": "https://example.com/profile", "categories": ["social"], "score": 3 } ] } ``` ## 工作原理 ### 1. 生成输入的多重变体 - 电话号码: - 原始号码 - +34 格式 - 0034 格式 - 带空格格式 - 用户名: - 直接查询 - 平台特定查询 ### 2. 构建搜索查询: - 通用查询 - 关键词增强查询(陪同、联系、按摩等) - 特定域查询 ### 3. 使用 DuckDuckGo(ddgs)获取结果 ### 4. 应用过滤: - 移除通用/分类页面 - 保留相关域名和类似个人资料链接 - 降低 SEO 噪声 ### 5. 处理每个结果: - 电话号码模块: - 检测广告类型(个人 / 群组 / 双人) - 检查标题/链接中是否存在电话号码 - 用户名模块: - 检测平台类别 - 根据相关信号分配分数 ### 6. 分类结果: - 高 → 强匹配 + 良好结构 - 中 → 部分相关 - 低 → 弱或噪声结果 ### 7. 输出结构化 JSON,便于分析 ## 当前限制 - 结果依赖于搜索引擎行为 - 某些平台会引入 SEO 密集型噪声 - 检测仅基于标题/链接(不解析完整页面) - 用户名检测是间接的(无 API 验证) - 尚未实现自动关联或聚类 ## 路线图 - 电子邮件 OSINT 模块 - 关联引擎(跨电话号码 / 用户名 / 电子邮件) - 检测跨配置文件的复用身份 - 模式检测(机构 / 多账号行为) - 导出为 CSV / Excel - 可选的全页抓取以进行深度验证 - CLI 接口(工具风格用法) ## 说明 该项目是更广泛 OSINT 工作流的一部分,专注于数据关联而非简单数据收集。 目标是将原始搜索结果转换为结构化且可操作的智能数据,从而实现在多个平台间检测模式。
标签:DDGS, ESC4, Homebrew安装, JSON导出, OSINT, Telegram, 个人资料链接检测, 个体检测, 二人组检测, 噪声过滤, 平台分类, 平台存在性汇总, 成人内容平台, 成人创作者, 手机号码侦查, 护送平台, 搜索查询生成, 数据去重, 模式检测, 用户名侦查, 电话号码验证, 电话格式解析, 相关性评分, 社交平台, 糖友平台, 约会平台, 置信度分类, 群组检测, 论坛, 跨平台关联, 逆向工具