1KevinFigueroa/vector4cyber
GitHub: 1KevinFigueroa/vector4cyber
将网络行动侦察和威胁情报数据向量化,利用向量数据库为AI驱动的安全分析提供语义搜索和关联能力的框架。
Stars: 7 | Forks: 1
项目 CONTEXT-CLUES
现代网络行动会产生海量且高维度的数据,包括警报、资产清单、扫描结果、DNS 和 TLS 遥测数据、威胁情报源等;然而,大多数团队仍然将这些数据强行塞入传统的行列模式中,而这些模式从未专为 AI 驱动的分析而设计。这是我的一种务实方法,旨在利用 Vector Databases (VectorDBs) 作为下一代威胁情报和侦察平台的核心,对你的网络行动数据进行现代化改造、向量化及可视化。 如何将异构网络数据(来自 Nmap、Amass、sslscan、被动 DNS 和 OSINT 来源等工具)转换为能够捕捉语义关系的 Embeddings——即资产、指标、行为和攻击路径之间的关系——而不仅仅是静态字段。一旦完成向量化,Qdrant 即可实现快速相似性搜索、上下文感知的 pivot(例如,“查找行为类似于此受损主机的资产”),以及用于活动或基础设施分组的自动化聚类。在此基础上,我们将展示如何利用 Qdrant 的过滤和元数据功能,将经典威胁搜寻(按 IP、ASN、标签、暴露面)与向量搜索工作流相结合。 本代码库将包含以下实时示例:构建一个小型开源 CyberOps 向量化数据流水线,将外部和内部攻击面姿态映射为向量,并利用降维和图样式视图可视化高风险资产邻域,以支持围绕 Qdrant 和其他向量数据库的侦察及威胁建模。用户将获得具体的模式、架构思路和代码级概念,可立即应用它们,用可扩展、AI 就绪、向量驱动的威胁情报骨干网来取代脆弱的仪表板和临时的电子表格。致贡献者
感谢所有对参与此 GitHub 项目感兴趣的人——我们真诚感谢大家的热情与支持。 目前,我们仍在积极发布和整理新组件,以建立稳定的基础。为避免冲突并确保顺畅的贡献流程,恳请大家暂时先不要提交请求。 一旦我们准备好接受外部贡献,将发布公告并提供明确的指南。所有获批的贡献者都将获得认可,并被列为项目的贡献者。 再次感谢您的耐心以及成为社区的一份子。我们非常期待很快能与您展开合作。标签:CTI, CyberOps, DNS分析, ESC4, GitHub, HTTP/HTTPS抓包, IP 地址批量处理, LLM, Nmap, OSINT, Qdrant, sslscan, Unmanaged PE, 人工智能, 向量化, 向量数据库, 威胁情报, 密码管理, 嵌入, 开发者工具, 异常检测, 态势感知, 插件系统, 攻击路径, 数据清洗, 数据预处理, 用户模式Hook绕过, 知识管理, 网络安全, 聚类分析, 虚拟驱动器, 语义搜索, 逆向工具, 隐私保护