partylogo/anthropic-podcast-feed
GitHub: partylogo/anthropic-podcast-feed
基于GitHub Actions的自动化播客RSS扫描工具,通过规则匹配检测特定公司员工作为嘉宾的播客节目并累积历史数据。
Stars: 0 | Forks: 0
# anthropic-podcast-feed
每日扫描的播客 RSS 源,通过基于规则的方式检测 Anthropic 员工嘉宾。用作 Anthropic 追踪每周摘要的长期累积数据库。
## 工作原理
GitHub Actions 每日 23:00 UTC(= 07:00 Asia/Taipei)运行:
1. `scripts/scan.js` — 获取所有已配置的 RSS 源,将新剧集追加到 `data/episodes.jsonl`(按 guid 去重)
2. `scripts/filter.js` — 将每个新剧集与 `data/roster.json` 进行匹配,划分置信度(`rule:strong` / `medium` / `weak` / `miss`),并追加到 `data/episodes-curated.jsonl`
3. 将更改提交回仓库
这两个 `.jsonl` 文件均为仅追加模式——历史状态通过 git 保留。
## 文件
| 文件 | 用途 |
|------|---------|
| `data/feeds.json` | `{name, url}` 格式的 RSS 源列表 |
| `data/roster.json` | Anthropic 员工姓名 + 账号 + 别名 |
| `data/episodes.jsonl` | 扫描过的所有剧集(每行一个 JSON) |
| `data/episodes-curated.jsonl` | 在上述基础上增加了 `is_anthropic`、`confidence`、`matched_names` 字段 |
## 本地运行
```
npm install
npm run all
```
无需 API 密钥——纯基于规则。
## 维护
- 添加源:编辑 `data/feeds.json`,添加 `{name, url}`
- 添加人物:编辑 `data/roster.json`,添加 `{handle, name, aliases: []}`
- 手动覆盖:编辑 `data/episodes-curated.jsonl`,修改 `is_anthropic` 字段
标签:Anthropic, BSD, CIS基准, CMS安全, ESC4, GitHub Actions, JavaScript, JSONL, MITM代理, OSINT, RSS, 云计算, 人物监测, 内存扫描绕过, 员工追踪, 周报, 实时处理, 播客, 数据去重, 数据持久化, 数据挖掘, 新闻追踪, 时序数据库, 每日扫描, 科技资讯, 网络调试, 自动化, 自动笔记, 自定义脚本, 规则引擎