vuln000/FinalThreatFeed
GitHub: vuln000/FinalThreatFeed
基于 Python Asyncio 的高性能威胁情报自动化采集与聚合框架,解决多源情报采集难、格式混乱、数据冗余等痛点。
Stars: 7 | Forks: 2
# FinalThreatFeed
🚀 **高性能开源威胁情报聚合引擎**
## 📖 项目简介
FinalThreatFeed 是一款现代化的威胁情报(CTI)自动化采集与融合框架。它基于高性能异步架构设计,旨在解决多源情报采集难、格式混乱、数据冗余等痛点。
通过标准化的数据处理管道,FinalThreatFeed 能够从全球开源情报源中持续汲取高价值数据,自动完成清洗、去重与结构化处理,为企业的安全防御体系提供精准、鲜活的威胁情报支撑。
### ✨ 核心特性
- ⚡ **极速异步架构**: 采用 Python Asyncio + HTTPX 构建高并发采集核心,大幅提升数据吞吐效率。
- 🧩 **全栈格式兼容**: 原生支持 MISP、CSV、Text 等主流情报格式,轻松打破数据源格式壁垒。
- 🧹 **智能清洗去重**: 内置精细化数据治理算法,自动剔除噪声与重复数据,确保情报的高信噪比。
- 🔄 **全生命周期管理**: 自动化的情报老化与更新机制,确保本地情报库始终保持最新状态。
- 🛠️ **灵活扩展配置**: 基于 YAML 的声明式配置管理,无需编码即可快速接入新的情报源。
- 🏷️ **深度 IOC 识别**: 自动解析并分类 IP、Domain、URL 等关键威胁指标,赋能精细化分析。
## 📡 订阅源状态监控
| 运行状态 | 情报源名称 | 格式类型 | 源地址 (URL) |
|:---:|---|:---:|---|
| 🟢 | **abuse.ch-SSL** | `csv` | https://sslbl.abuse.ch/blacklist/sslblacklist.csv |
| 🟢 | **Alienvault-IP-Reputation** | `csv` | https://reputation.alienvault.com/reputation.generic |
| 🔴 | **Phishtank** | `csv` | https://data.phishtank.com/data/online-valid.csv |
| ⚫ | **Tor_Exit_Nodes** | `text` | https://check.torproject.org/torbulkexitlist |
| 🟢 | **IPsum-l4** | `text` | https://raw.githubusercontent.com/stamparm/ipsum/master/levels/4.txt |
| 🟢 | **IPsum-l5** | `text` | https://raw.githubusercontent.com/stamparm/ipsum/master/levels/5.txt |
| 🟢 | **CIRCL OSINT Feed** | `misp` | https://www.circl.lu/doc/misp/feed-osint/ |
| 🟢 | **abuse.ch** | `misp` | https://threatfox.abuse.ch/downloads/misp |
| 🟢 | **abuse.ch-Bazaar** | `misp` | https://bazaar.abuse.ch/downloads/misp/ |
| 🟢 | **abuse.ch-URLhasus** | `misp` | https://urlhaus.abuse.ch/downloads/misp |
| 🟢 | **Botvrij.eu** | `misp` | https://www.botvrij.eu/data/feed-osint |
#### 📊 运行状态图例
- 🟢 **运行正常**: 成功连接并获取最新情报数据
- 🔴 **采集异常**: 连接超时或源数据格式错误
- ⚫ **已禁用**: 当前配置下未启用的情报源
## 🚀 快速开始
### 1. 环境准备
pip install -r requirements.txt
### 2. 启动引擎
python main.py
## ⚙️ 配置指南
所有情报源均通过 `config/feeds.yaml` 进行声明式管理,支持灵活的自定义扩展:
feeds:
- name: "Feed名称"
enabled: true
url: "[https://example.com/feed.csv](https://example.com/feed.csv)"
source_format: "csv" # 支持 csv, text, misp
description: "简短的情报源描述"
# 不同类型的源支持特定的高级配置参数
## 📂 数据产出
- `output/description.json`: **情报源下载描述**
- `output/collections.csv`: **原始采集数据** (增量缓存)
- `output/final_threat.csv`: **最终情报库** (已清洗、去重、标准化的全量高价值情报)
## 📄 开源协议
本项目遵循 [MIT License](LICENSE) 开源协议。
标签:Asyncio, CSV, ESC4, IOC, IP黑名单, OSINT, Python, YAML配置, 信噪比, 去重, 域名黑名单, 威胁情报, 实时处理, 密码管理, 开发者工具, 异步IO, 情报搜集, 数据清洗, 数据生命周期, 数据聚合, 无后门, 网络调试, 自动化, 逆向工具