mehmetcetinn9999/Log-Analysis-Via-RAG

GitHub: mehmetcetinn9999/Log-Analysis-Via-RAG

基于 RAG 的网络安全日志分析系统，利用混合检索和 LLM 推理从安全日志中自动提取 IOC、检测威胁并提供可解释的预测性安全评估。

Stars: 0 | Forks: 0

# 基于 RAG 的预测性日志分析一个基于检索增强生成（RAG）的网络安全助手，专为智能日志分析、威胁检测和预测性安全评估而设计。 ## 概述基于 RAG 的预测性日志分析结合了大型语言模型（LLM）、威胁情报源和混合信息检索技术，用于分析安全日志并提供具备上下文感知能力的网络安全洞察。该系统集成了多种网络安全知识源，包括 MITRE ATT&CK 和 CISA 已知被利用漏洞（KEV），使安全分析师能够利用有据可查的响应来调查可疑事件。 ## 功能 ### 混合检索 * BM25 关键词检索 * ChromaDB 向量相似性搜索 * 倒数排名融合（RRF） ### 威胁情报集成 * MITRE ATT&CK 知识库 * CISA KEV 目录 * 自定义威胁报告 ### IOC 提取自动提取： * IPv4 / IPv6 地址 * 域名 * URL * 电子邮件地址 * CVE 标识符 * MITRE ATT&CK 技术 ID * MD5 / SHA1 / SHA256 哈希值 ### 预测性安全评估该系统不仅解释观察到的安全事件，还根据检索到的威胁情报识别潜在的未来风险和攻击模式。 ### 评估与可观测性 * 检索评估 pipeline * 查询日志记录 * 延迟跟踪 * 来源归属 ## 架构 ``` Security Logs │ ▼ IOC Extraction │ ▼ Hybrid Retrieval (BM25 + ChromaDB) │ ▼ Threat Intelligence Context (MITRE + CISA + Reports) │ ▼ LLM Analysis │ ▼ Threat Detection & Prediction ``` ## 技术栈 | 组件 | 技术 | | ---------------- | ---------------------- | | LLM | Groq / OpenAI / Ollama | | Embeddings | all-MiniLM-L6-v2 | | 向量数据库 | ChromaDB | | 稀疏检索 | BM25 | | 框架 | LangChain | | 界面 | Streamlit | | 评估 | 自定义指标 | ## 安装 ``` git clone cd project python -m venv venv source venv/bin/activate # Windows： venv\Scripts\activate pip install -r requirements.txt ``` 运行： ``` streamlit run app.py ``` ## 项目结构 ``` project/ ├── app.py ├── rag_engine.py ├── ingest.py ├── ioc_extractor.py ├── evaluate.py ├── config.py ├── data/ ├── vectorstore/ ├── eval/ └── query_log.jsonl ``` ## 学术参考文献 1. Lewis et al. (2020) – Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks 2. MITRE ATT&CK Framework 3. CISA Known Exploited Vulnerabilities Catalog ## 生成式 AI 的使用生成式 AI 工具用于： * 完善文档 * 代码调试 * 文献探索核心系统的设计、实现、集成、评估和项目开发均由项目作者完成。 ## 作者计算机工程系穆拉锡特科·科奇曼大学 2025–2026 春季学期项目

标签：AI风险缓解, Kubernetes, LLM推理, RAG, 向量检索, 威胁情报, 安全日志分析, 安全运营, 开发者工具, 异常检测, 扫描框架, 逆向工具