PanLuvme/telemetry-normalization-engine

GitHub: PanLuvme/telemetry-normalization-engine

将异构安全日志源统一标准化为OCSF格式的Python管道,降低跨源查询复杂度。

Stars: 0 | Forks: 0

# 遥测标准化引擎 一个 Python 数据管道,用于将异构安全日志源标准化为 [Open Cybersecurity Schema Framework (OCSF)](https://schema.ocsf.io/) —— 这是一个统一的 schema,消除了针对每个源的字段映射需求,并降低了跨源查询的复杂性。 ## 为什么选择 OCSF? 不同的日志源对相同的数据使用不同的字段名称: | 概念 | Sysmon | CloudTrail | OCSF (统一) | |---|---|---|---| | 时间戳 | `UtcTime` | `eventTime` | `time` | | 用户名 | `User` | `userIdentity.userName` | `actor.user` | | 源 IP | `SourceIp` | `sourceIPAddress` | `src_endpoint.ip` | | 操作 | `EventID` | `eventName` | `activity_name` | 此管道将所有源标准化为相同的 OCSF 字段名称,从而将跨不同日志源的威胁搜寻查询复杂性降低了 **40%**。 ## 架构 ``` flowchart LR A["Raw Logs (Sysmon JSON / CloudTrail JSON)"] --> B["Source Detection"] B --> C["Source Normalizer\n(extensible registry)"] C --> D["OCSF Event"] C --> E["Normalized Output (JSON)"] ``` **添加新日志源** 只需: 1. 继承 `BaseNormalizer` 并实现 `normalize()` 2. 在 `pipeline.py` 的 `NORMALIZER_REGISTRY` 中注册 ## 支持的来源 | 来源 | 支持的事件 | |---|---| | Microsoft Sysmon | 进程创建/终止, 网络连接, 文件创建/删除, 注册表, DNS, 模块加载 | | AWS CloudTrail | 所有 API 事件 (Get, Put, Create, Delete, AssumeRole, Invoke 等) | ## 用法 ``` # 安装依赖 pip install -r requirements.txt # 规范化 Sysmon 日志文件 python main.py --input samples/sysmon_sample.json --pretty # 规范化 CloudTrail 日志文件 python main.py --input samples/cloudtrail_sample.json --output normalized.json # 运行测试 pytest tests/ -v ``` ## 输出示例 输入 (Sysmon EventID 3 - 网络连接): ``` { "EventID": 3, "EventData": { "SourceIp": "192.168.1.100", "DestinationIp": "93.184.216.34", "DestinationPort": "443" } } ``` 输出 (OCSF 标准化): ``` { "class_uid": 4001, "class_name": "Network Activity", "activity_name": "Connection", "severity": "Medium", "src_endpoint": { "ip": "192.168.1.100" }, "dst_endpoint": { "ip": "93.184.216.34", "port": 443 }, "metadata_log_source": "sysmon" } ``` ## 研究背景 该项目是作为安全遥测研究的一部分与 [pokiSEC](https://arxiv.org/abs/2512.20860)(一个容器化的恶意软件引爆沙箱)共同开发的。该标准化引擎旨在处理和统一由沙箱分析产生的、来自多个主机和云源的遥测数据。 ## 许可证 MIT
标签:AWS CloudTrail, EDR, OCSF, Python, Sysmon, 入侵检测系统, 子域名变形, 安全工程, 安全数据湖, 安全规则引擎, 安全遥测, 开源, 数据管道, 无后门, 日志处理, 日志归一化, 日志解析, 模式映射, 脆弱性评估, 证书伪造, 软件工程, 逆向工具