17somh1/ThreatDigest

GitHub: 17somh1/ThreatDigest

一个基于 Python 和 OpenAI 的自动化每日威胁情报摘要工具，通过聚合 RSS 订阅源生成教育性新闻简报并自动部署为静态站点。

Stars: 0 | Forks: 0

# ThreatDigest 一个具有辛辣且富有教育意义风格的、作品集级别的每日威胁摘要。它通过摄取免费的 RSS/Atom 订阅源，对条目进行过滤和排名，使用 OpenAI 将每条内容总结为严格的 JSON schema，并通过 GitHub Pages 发布静态站点。 ## 架构 ``` RSS/Atom feeds -> filter + dedupe + rank -> OpenAI JSON summaries | | +--> editor layer ----> clusters -> themes (OpenAI) Rendered HTML -> docs/index.html + docs/archive/YYYY-MM-DD.html ``` ## 本地运行 ``` python -m venv .venv source .venv/bin/activate pip install -r requirements.txt export OPENAI_API_KEY=... python -m src.main ``` 输出： - `docs/index.html` - `docs/archive/YYYY-MM-DD.html` ## 配置 - `config/settings.yaml` 包含 RSS 订阅源列表。 - 环境变量： - `OPENAI_API_KEY`（必填） - `OPENAI_MODEL`（可选，默认为 `gpt-4o-mini`） - `MAX_ITEMS`（可选，默认为 `15`） - `RECENT_HOURS`（可选，默认为 `48`） ## 成本控制 - 仅考虑最近（过去 24-48 小时）的条目。 - 通过规范 URL 和标准化标题哈希进行去重。 - 限制每次运行总结的条目数量（`MAX_ITEMS`）。 ## 方法论该 pipeline 使用关键词和来源过滤器仅保留相关条目，对其进行确定性排名，并使用严格的 JSON schema 对每条内容进行总结。编辑层将相关条目聚类为故事，强制进行优先级排序（头条故事、前三条，然后是上下文），并将每次输出限制为 6 个聚类。使用的任何术语必须为初学者提供定义。如果来源内容单薄，模型会被指示将置信度设置为 LOW 并解释不确定性。 ## GitHub Actions `.github/workflows/digest.yml` 中的 workflow 每日按计划运行，生成摘要，并将 `docs/` 部署到 GitHub Pages。

标签：AI自动化, DLL 劫持, DNS解析, GitHub Actions, GitHub Pages, Newsletter, OpenAI, Petitpotam, Python, RSS聚合, 信息过滤, 内存规避, 内容生成, 大语言模型, 威胁情报, 安全快讯, 开发者工具, 开源项目, 技术分享, 无后门, 智能写作, 每日摘要, 网络安全, 自动化新闻, 自动笔记, 逆向工具, 隐私保护, 静态站点