hnsh3in/Threat_Intel_Digest

GitHub: hnsh3in/Threat_Intel_Digest

这是一个基于n8n和Claude API的自托管威胁情报管道,通过AI对超过20个安全RSS源进行个性化过滤和摘要,以低成本为安全团队提供精炼、高相关的每日威胁情报。

Stars: 1 | Forks: 0

# 威胁情报摘要 一个自托管的威胁情报管道,每日两次摄取超过20个安全RSS源,将每条信息通过根据您组织技术栈和地区校准的Claude AI分类引擎处理,并仅提供真正相关的精炼摘要——让您获取重要的威胁信息,而非淹没在原始信息流的噪音中。 基于n8n(自托管,Docker)、AWS Lightsail和Anthropic Claude API构建。运行成本低于每月12美元。 ## 独特之处 大多数开源威胁情报管道仅止步于摄取——将少数RSS源输入摘要提示并推送到频道。本项目旨在真正实现日常可用性: - **20+信息源** - 覆盖威胁情报、数字取证与事件响应(DFIR)、供应商研究、工业控制系统/操作技术(ICS/OT)和国家计算机应急响应小组(CERT)。高信号、低流量的来源如The DFIR Report和Malware Traffic Analysis,与高流量来源如Bleeping Computer和The Hacker News并存。 - **相关性过滤,而非仅摘要** - 每条信息在生成摘要前,都会根据您的组织、分析师技术栈和监控区域进行评分。与您无关的噪音永远不会到达您的收件箱。 - **两阶段设计保持低成本** - 分类仅基于标题和摘要片段运行;摘要调用仅针对通过阈值的项目触发。您获得广泛覆盖而无需为所有内容摘要付费。 - **针对机器屏蔽信息源的回退抓取** - 拒绝默认爬虫的信息源(如BankInfoSecurity, Fortiguard)将使用浏览器User-Agent重试,确保它们不会被静默丢弃。 - **为校准而设计,而非设置后遗忘** - 审计日志记录每个判定(`PASSED` / `REJECTED` / `UNSCORED`)及其评分和原因。两周后,您可以准确看到阈值设置过严或过松的位置,并相应调整提示。 - **所有内容基于真实数据** - 评分标准、自动提升规则和阈值均根据实际管道运行数据进行校准。示例输出是真实的摘要执行结果,而非模拟数据。 ## 功能特性 - **双阶段Claude管道** - 分类首先对每条项目评分(成本效益高);摘要仅对通过阈值的项目运行,保持低token使用量 - **21个RSS信息源**,涵盖威胁情报、DFIR、供应商研究、ICS/OT和国家CERT - **相关性评分(0-10)** - 可根据您的技术栈和区域进行配置 - **分类提示中的自动提升和自动降级规则**,用于处理边缘案例(如CISA KEV新增条目、针对关键国家基础设施的国家级攻击活动、信息窃取器IOC投放、钓鱼即服务基础设施) - **双层回退抓取** - 优先使用n8n RSS节点,其次使用带有浏览器`User-Agent`的HTTP回退(处理如BankInfoSecurity和Fortiguard等被机器屏蔽的信息源) - **通过n8n SQLite实现跨执行去重** - 在之前运行中已见过的项目将被抑制 - **每次运行的12小时pubDate过滤**,对无日期项目进行透传,避免静默信息源丢弃 - **审计日志**(Google Sheets)记录每个项目:`PASSED`、`REJECTED`或`UNSCORED` - 用于分类阈值校准 - **错误通知分支** - 失败的信息源将向Discord和Gmail发送警报,包含信息源名称、URL、HTTP状态和错误详情 - **Discord分块** - 输出在项目边界处分割,每条消息最大1,950字符,webhook调用间延迟2秒,以防止429错误并保持顺序 ## 预估运行成本 | 组件 | 成本 | |---|---| | Claude API (Haiku) | 每日两次频率、21个信息源下低于每月5美元 | | AWS Lightsail | 每月7美元(1GB内存,2个vCPU) | ## 示例输出 **邮件摘要** ![邮件摘要](https://static.pigsec.cn/wp-content/uploads/repos/2026/05/ada1050f9c011416.png) **审计日志 - 信息源噪音分析** ![信息源噪音分析](https://static.pigsec.cn/wp-content/uploads/repos/2026/05/9f19598db7011421.png) **审计日志 - 分类数据** ![分类审计](https://static.pigsec.cn/wp-content/uploads/repos/2026/05/7a00339451011427.png) 完整输出示例包括错误通知,请查看 [samples/](./samples/) 文件夹。 ## 技术栈 | 组件 | 技术 | |---|---| | 编排 | [n8n](https://n8n.io/)(自托管,Docker) | | 托管 | AWS Lightsail - Ubuntu 24.04 LTS | | 人工智能 / 分类 | Anthropic Claude API (`claude-haiku-4-5-20251001`) | | 通知 | Discord Webhook, Gmail (OAuth2) | | 审计日志 | Google Sheets (OAuth2) | | 语言 | JavaScript (n8n Code节点) | | 去重 | n8n SQLite(内置,跨执行) | ## 前置条件 - AWS Lightsail实例(或任何Linux VPS) - 运行Ubuntu 24.04 LTS,1GB内存 - n8n(自托管) - 运行v2.14.2 - Anthropic API密钥 ([console.anthropic.com](https://console.anthropic.com)) - **在激活前,请在控制台 > 设置 > 限制中设置每月支出上限**,以在密钥泄露时限制损失 - 带有webhook URL的Discord服务器 - 在Google Cloud Console中配置了OAuth2的Gmail账户 - Google Sheets(用于审计日志) 逐步配置说明请参见 [SETUP.md](./SETUP.md)。 ## 管道阶段 ### 阶段1 - 分类 - 输入:仅`标题` + `内容摘要`(紧凑、成本高效) - 模型:`claude-haiku-4-5-20251001`,最大token数:2000 - 输出:JSON数组 - `{ id, score, category, reason }` - 阈值:分数 >= 4 通过;分数 < 4 被拒绝 **评分标准(0-10):** | 分数 | 标准 | |---|---| | 10 | 直接提及您的组织或核心平台。在完全相同的分析师技术栈中存在被主动利用的零日漏洞。 | | 8-9 | 针对您目标区域关键国家基础设施的国家级攻击活动。勒索软件攻击关键国家基础设施。您所在行业关键系统和操作平台的漏洞。安全或IT工具链的供应链受损。PAM/特权访问受损。 | | 6-7 | Windows/AD/Azure攻击技术(Kerberoasting, DCSync, ADCS, OAuth滥用, AiTM, BYOVD)。新的勒索软件战术、技术和程序(TTP)。AI/大语言模型攻击(提示注入、MCP漏洞利用)。容器/K8s逃逸。带有IOC的信息窃取器活动。钓鱼即服务基础设施。SIEM/XDR规避。 | | 4-5 | 数字取证与事件响应(DFIR)和检测工程(Sigma, KQL, YARA, Sysmon, Velociraptor)。MITRE ATT&CK研究。Linux/macOS企业攻击。具有远程代码执行/服务端请求伪造/身份验证绕过原始漏洞的CVE,但未确认利用。 | | 2-3 | 通用漏洞披露。安全行业新闻。相关性较低的研究。 | | 0-1 | 供应商营销、会议公告、消费者建议、离题内容。 | ### 阶段2 - 摘要 - 输入:仅阈值通过的项目 - 模型:`claude-haiku-4-5-20251001`,最大token数:10000 - 每项输出:标题、来源、发布时间、类别、相关性分数、摘要(2句话)、建议操作、阅读更多链接 - 按相关性分数降序排序 - `triageScore` 原样使用 - 模型被指示不调整该分数 ## 工作原理 每次运行两次Claude API调用 - 先分类,仅对通过的内容进行摘要。 ``` flowchart TD A([Schedule Trigger\n00:00 & 12:00 UTC]) --> B[RSS Feed List\n21 feeds] B --> C[Clear Accumulator] C --> D[Split Feed Array] D --> E{Loop Feeds\nbatch size 1} E --> F[Fetch RSS\nn8n RSS node] F --> G[Unpack Feed Fallback] G --> H{Error?} H -- Yes --> I[HTTP Fallback Fetch\nbrowser User-Agent] I --> J[Parse RSS XML\nregex, RSS 2.0 + Atom] J --> K{Still failing?} K -- Yes --> L[Format Error Notification] L --> M[Gmail Error Alert] L --> N[Discord Error Alert] N --> O[Rate Limit Delay 2s] K -- No --> O H -- No --> O O --> P[Accumulate Items\nworkflow static data] P --> Q{All feeds done?} Q -- No --> E Q -- Yes --> R[Read Accumulated Items] R --> S[Filter pubDate 12h] S --> T[Deduplicate by Link\ncross-execution SQLite] T --> U[Aggregate Items] U --> V[Build Triage Payload] V --> W[[Claude Haiku\nStage 1: Triage\nJSON score array]] W --> X[Decode Claude Response] X --> Y[Parse + Filter\nthreshold score 4] Y --> Z[Audit Rows] Z --> AA[(Google Sheets\nAudit Log)] Y --> AB[Build Summary Payload] AB --> AC[[Claude Haiku\nStage 2: Summarise\nsurvivors only]] AC --> AD[Format Gmail] AC --> AE[Format Discord] AD --> AF[Gmail\nHTML digest] AE --> AG[Split In Batches] AG --> AH[Discord Webhook] AH --> AI[Wait 2s] AI --> AG ``` ## RSS信息源(21个) | 来源 | 类型 | |---|---| | The Hacker News | 综合威胁新闻 | | Bleeping Computer | 漏洞和恶意软件新闻 | | Krebs on Security | 调查性威胁情报 | | Dark Reading | 行业安全新闻 | | BankInfoSecurity | 金融行业 / 关键国家基础设施 | | Cisco Talos | 供应商威胁研究 | | Palo Alto Unit 42 | 供应商威胁研究 | | Malwarebytes Blog | 恶意软件分析 | | Microsoft Security Blog | 微软技术栈公告 | | Rapid7 Blog | 漏洞研究 | | SANS ISC | 每日威胁指标 | | Fortiguard IR | 供应商事件响应公告 | | Recorded Future | 威胁情报 | | Malware Traffic Analysis | 数据包捕获 / 流量分析 | | CISA ICS Advisories | OT/ICS公告 | | The DFIR Report | DFIR案例研究 | | JPCERT/CC | 国家计算机应急响应小组 | | Elastic Security Labs | 检测研究 | | CrowdStrike Blog | 供应商威胁研究 | | SentinelOne Labs | 恶意软件和威胁研究 | | Red Canary | 检测工程 | ## 仓库结构 ``` Threat_Intel_Digest/ ├── README.md # This file ├── SETUP.md # Deployment and configuration guide ├── FEEDS.md # Feed list with notes ├── samples/ # Sample output screenshots │ ├── discord_digest.png │ ├── gsheet_triage_audit.png │ └── gsheet_feed_noise_analysis_chart.png └── workflow/ └── Threat_Intel_Digest_Published_v1.0.json # n8n workflow export (sanitised) ``` ## 路线图 - [ ] 通过RSS桥接或Bot API进行Telegram信息源摄取 - [ ] 暗网泄露站点和地下论坛的洋葱站点爬取(Tor + 爬虫) - [ ] 每周汇总摘要 - [ ] 在摘要提示中添加MITRE ATT&CK技术标签 - [ ] 提取IOC(IP地址、域名、哈希值、CVE ID)到结构化输出 - [ ] 检测规则建议(Sigma / KQL / YARA)由摘要提示生成 ## 许可证 MIT
标签:AI驱动, AWS云服务, Claude API, Discord通知, Docker容器, Gmail推送, n8n工作流, RSS订阅, 威胁分析, 威胁情报, 安全运营, 工作流自动化, 开发者工具, 情报聚合, 成本优化, 扫描框架, 摘要生成, 攻击面发现, 数据可视化, 相关性过滤, 网络安全, 网络调试, 自动化, 自动化侦查工具, 自动通知, 自托管, 请求拦截, 隐私保护