AaineeSinha/ThreatIntel-Agent-Autonomous-Cyber-Threat-Intelligence

GitHub: AaineeSinha/ThreatIntel-Agent-Autonomous-Cyber-Threat-Intelligence

一款结合实时 OSINT 数据与 Gemini LLM 的自动化网络威胁情报仪表板，能将原始威胁指标转化为包含 MITRE 映射和防御规则的企业级修复报告。

Stars: 0 | Forks: 0

# 📄 ThreatIntel Agent：自主网络威胁情报仪表板 🤖 ### 在线演示:- https://threatintel-agent-autonomous-cyber-threat-intelligence-fhmbkqx.streamlit.app/ ### 概述 🌟 ThreatIntel Agent 是一款强大且可用于生产环境的自动化安全编排与响应 (SOAR) 应用程序，旨在自动化实时开源情报 (OSINT) 收集和防御性剧本生成。通过将实时全球威胁注册表与先进的大型语言模型 (LLM) 相结合，该解决方案将原始技术威胁指标转化为全面、易于理解的企业缓解剧本。💡 ### 问题 🚩 安全运营中心 (SOC) 分析师和事件响应人员不断被海量原始失陷指标 (IOC) 所淹没——例如可疑的 IP 地址、欺骗性域名和恶意文件哈希。手动查询多个开源情报注册表、解析复杂的 JSON payload、将行为映射到安全框架以及编写修复脚本非常耗时，并会减缓事件遏制响应时间。📉 ### 解决方案 🚀 该项目利用多阶段 AI Agent pipeline 获取单一威胁向量，并完全自动化调查工作流程。主要亮点包括： * 🔹 **实时 OSINT 遥测：** 查询 **VirusTotal v3 REST API** 以拉取实时全球信誉数据、供应商检测计数和行为类别。🎯 * 🔹 **上下文 LLM 推理：** 将原始安全指标输入 **Gemini 2.5 Flash** 以分析威胁态势，绕过静态数据库限制并检测全新的钓鱼基础设施。🧠 * 🔹 **异步状态遥测：** 使用 Python 生成器架构 (`yield`) 实现流式 pipeline，将实时后台操作日志直接传输到用户界面。⚡ * 🔹 **自动化事件剧本：** 立即生成可下载的高管级 Markdown 报告，其中包含战术防御剧本和自定义防火墙遏制规则。💾 ### 技术栈 🛠️ * 🐍 **Python：** 核心后端和数据处理 pipeline 逻辑。 * 🌐 **Streamlit：** 用于构建高度响应式 Web 应用程序的框架。 * 🧠 **Google Gemini (Google Generative AI)：** 用于自然语言合成和上下文分析的高级推理引擎。 * 🛡️ **VirusTotal API v3：** 用于实时指标追踪的外部威胁情报注册表。 * ⚙️ **Python-Dotenv & Requests：** 用于安全的环境 token 管理和处理外部 RESTful HTTP 请求。 ### 系统架构 🏗️ 该应用程序采用高度模块化、解耦的架构，将用户界面与核心自动化逻辑分离开来： ``` [User Interface (ui.py)] ──(Inputs Threat Indicator)──> [Main Engine (main.py)] │ (Invokes Pipeline Loop) ▼ [Streamlit UI] <──(Streams Markdown Report)── [Intel Agent (agents.py)] <──> [VirusTotal API] ``` ### 分析能力 🧠 当指标被输入 pipeline 时，AI 高级事件响应 Agent 会基于实时指标进行分析，从而制定出： * 📊 **高管威胁摘要与严重性评估：** 上下文风险分类（例如，即使供应商检测次数为 0，也能捕获品牌冒充/钓鱼域名）。 * 🔍 **MITRE ATT&CK 矩阵映射：** 明确识别对手战术、技术和特定子技术 ID（例如，Reconnaissance、Resource Development、Credential Access）。 * 🛡️ **企业修复剧本：** 具有可操作性的技术控制，包括 DNS 黑洞/ Sinkhole、安全 Web 网关 (SWG) 规则、电子邮件网关传输策略和出站防火墙规则。 ### 如何在本地运行 💻 1. **前置条件：** Python 3.11+ 2. **设置工作区：** ``` git clone [https://github.com/AaineeSinha/ThreatIntel-Agent-Autonomous-Cyber-Threat-Intelligence.git](https://github.com/AaineeSinha/ThreatIntel-Agent-Autonomous-Cyber-Threat-Intelligence.git) cd ThreatIntel-Agent-Autonomous-Cyber-Threat-Intelligence python -m venv .venv source .venv/bin/activate # On Windows use: .venv\Scripts\activate pip install -r requirements.txt ``` 3. **配置密钥：** 在根目录下创建一个 `.env` 文件，并安全地添加您的 API 访问密钥： ``` GOOGLE_API_KEY=your_gemini_api_key_here VIRUSTOTAL_API_KEY=your_virustotal_api_key_here ``` 4. **执行：** ``` streamlit run main.py ``` ## 🔍 实时测试指南与指标参考为了展示 **ThreatIntel Agent** 的多阶段 pipeline、自动化框架映射和上下文推理能力，请将以下任何真实世界的威胁指标复制并粘贴到实时仪表板中。 | # | 指标类型 | 测试指标字符串 | 预期威胁概况与 AI 行为 | |---|----------------|-----------------------|---------------------------------------| | 1 | **IP 地址** | `185.196.220.30` | **网络扫描器：** 触发活跃的恶意检测计数。Gemini 将其归类为基础设施侦察，并为 Web 端口（`80`、`443`）生成严格的边缘防火墙丢弃规则。 | | 2 | **IP 地址** | `45.150.111.41` | **SSH 暴力破解器：** 与自动化撞库相关联。该 Agent 将此映射到 **MITRE ATT&CK: T1110 (Brute Force)**，并设计身份验证审计剧本。 | | 3 | **IP 地址** | `91.240.118.172` | **命令与控制 (C2)：** 识别活跃的 C2 节点脚本 endpoint。触发 CRITICAL 级别严重性评估，重点关注内部主机隔离和横向移动分类。 | | 4 | **域名** | `wellsfargosecure-login.com` | **品牌冒充：** 模拟新部署的钓鱼攻击。即使全球供应商检测率很低，Gemini 的语义引擎也会根据名称结构对其进行标记，并详细说明自定义 DNS sinkhole 规则。 | | 5 | **域名** | `paypal-security-update-center.com` | **凭证收割机：** 被标记为金融社会工程基础设施。无缝映射到 **MITRE ATT&CK: T1566.001 (Phishing: Spearphishing Link)**。 | | 6 | **域名** | `login-microsoft365-verify.com` | **云认证门户钓鱼：** 旨在劫持企业账户 (BEC)。该剧本优先考虑立即撤销企业会话并强制重置多因素身份验证 (MFA)。 | | 7 | **域名** | `duckdns.org` | **动态 DNS 灰色软件：** 经常被威胁行为者滥用的合法服务。测试 AI 处理模糊信誉评分的能力，而不会强制执行适得其反的一揽子封锁。 | | 8 | **文件哈希** | `09fa86e733ea07167e469da304d5a2eb` | **Wacatac 木马 (MD5)：** 高度可识别的恶意软件指纹。VirusTotal 标记了高恶意指标，促使 AI 将行为映射到 **MITRE ATT&CK: TA0003 (Persistence)**。 | | 9| **文件哈希** | `24d00b8616e3b1d9d80cef9d421081c54b3754c09624fe4613c71bf9e394cfbf` | **WannaCry 蠕虫 (SHA-256)：** 标志性的勒索软件特征。Gemini 绕过通用遏制措施，发布详细的本地化剧本，指导修补 SMB 漏洞（`Port 445`）。 | | 10| **文件哈希** | `7a963428d022ec102c98d6006e0f7725` | **Emotet 下载器 (MD5)：** 臭名昭著的银行僵尸网络基础设施。触发复杂的威胁修复循环，旨在搜寻二级 payload 释放器和隐藏的二进制树。 | ### 🚀 快速复制备忘单为了进行快速的手动测试，您可以直接从这些终端代码块中获取快速字符串： ``` # 测试用例：Active Malicious Network IP 185.196.220.30 # 测试用例：Targeted Financial Phishing Domain wellsfargosecure-login.com # 测试用例：Trojan Malicious Binary Hash 09fa86e733ea07167e469da304d5a2eb ``` ### 未来展望 🔮 * 🚀 **多源 OSINT 聚合：** 使用异步 Python 请求扩展 Agent，以并发查询多个威胁池（例如，AlienVault OTX、AbuseIPDB、Shodan）。 * 📁 **本地沙箱文件哈希计算：** 允许直接上传可疑的本地文档，使用 Python 自动计算加密 MD5/SHA-256 哈希，以供立即进行 API 获取。 * 📊 **历史威胁注册表：** 集成本地数据库配置（SQLite/PostgreSQL），以存储以前审计过的威胁报告的历史存档，用于持续的企业监控。祝您防御顺利！🛡️✨ 保持您的基础设施安全，并保持您的响应工作流自动化。🥂

标签：DLL 劫持, Kubernetes, PB级数据处理, Python, SOAR, Streamlit, 大语言模型, 威胁情报, 字符串匹配, 安全运维, 开发者工具, 无后门, 访问控制, 逆向工具