Ayush75-arch/H2H-BinaryBandits-Network_Log_Translator
GitHub: Ayush75-arch/H2H-BinaryBandits-Network_Log_Translator
AI 驱动的网络日志翻译器,将原始日志结构化并生成自然语言摘要以加速事件响应。
Stars: 0 | Forks: 0
# 🚀 AI 驱动的网络日志翻译器
## 📌 概述
**AI 驱动的网络日志翻译器**是一款网络安全工具,使用解析、异常检测和 AI 辅助摘要,将原始网络日志(Syslog、SNMP、AWS VPC 流日志)转换为**可读性强的人类洞察**。
它通过让复杂日志对技术用户和非技术用户都易于理解,帮助**缩短事件响应时间**。
## 🎯 问题陈述
网络日志存在以下问题:
* 结构复杂,难以阅读
* 手动分析耗时
* 非专家难以解读
➡️ 这会导致**事件响应延迟**和遗漏威胁。
## 💡 解决方案
本项目:
1. 将原始日志解析为结构化数据
2. 检测异常(基于规则 + 可选机器学习)
3. 分类严重级别
4. 使用 AI 生成**通俗易懂的英文解释**
## 🧱 架构
```
Raw Logs
↓
Parser (Regex / Log Extraction)
↓
Structured JSON
↓
Anomaly Detection
↓
Log Classification
↓
AI Summarization (LLM)
↓
Human-Readable Output / Dashboard
```
## ⚙️ 技术栈
* **Python**
* **Pandas** – 数据处理
* **Regex** – 日志解析
* **OpenAI / LLM API** – 自然语言生成
* **Scikit-learn(可选)** – 异常检测
* **FastAPI(可选)** – API 后端
* **JSON / CSV 日志**
## 📂 项目结构
```
ai-log-translator/
│
├── logs/
│ ├── syslog.log
│ ├── snmp.log
│ └── vpc_flow.log
│
├── parser/
│ └── log_parser.py
│
├── detection/
│ └── anomaly_detector.py
│
├── classification/
│ └── classifier.py
│
├── summarizer/
│ └── llm_summarizer.py
│
├── pipeline.py
├── app.py (optional FastAPI)
├── requirements.txt
└── README.md
```
## 🔍 功能
### ✅ 日志解析
* 提取:
* 时间戳
* 源 IP
* 严重级别
* 消息内容
* 支持:
* Syslog
* SNMP 陷阱
* AWS VPC 流日志
### 🚨 异常检测
* 基于规则的检测:
* 重复登录失败
* 端口扫描
* 流量突增
* 可选机器学习:
* 孤立森林(异常检测)
### 🏷️ 日志分类
每条日志被归类为:
* 🔴 **严重** – 攻击、故障、入侵
* 🟡 **警告** – 异常活动
* 🟢 **信息** – 正常操作
### 🤖 AI 辅助解释
示例:
**输入日志:**
```
Failed SSH login from 192.168.1.10 on port 22
```
**输出:**
```
A device at IP 192.168.1.10 attempted to access the system via SSH but failed authentication. This may indicate unauthorized access attempts.
```
## 🚀 安装
```
git clone https://github.com/your-username/ai-log-translator.git
cd ai-log-translator
pip install -r requirements.txt
```
## 🔑 环境配置
创建 `.env` 文件:
```
OPENAI_API_KEY=your_api_key_here
```
## ▶️ 使用
运行管道:
```
python pipeline.py
```
可选(API 模式):
```
uvicorn app:app --reload
```
## 📊 输出示例
```
{
"timestamp": "2026-04-15 10:15:23",
"source_ip": "192.168.1.10",
"severity": "HIGH",
"category": "CRITICAL",
"anomaly": true,
"summary": "Multiple failed login attempts detected, indicating a possible brute-force attack."
}
```
## ⏱️ 清晰度时间指标
本项目衡量:
### 目标:
将分析时间从**分钟级 → 秒级**
## 🔐 安全使用场景
* 安全运营中心(SOC)
* 事件响应自动化
* 威胁检测
* 日志监控系统(SIEM 增强)
## 🔮 后续改进
* 实时日志流(Kafka 集成)
* 仪表板(React + 图表)
* 多语言解释
* 与 SIEM 工具集成(Splunk、ELK)
* 高级机器学习异常检测模型
## 📜 许可证
MIT 许可证
## 👨💻 作者
Ayush Krishnan P & Hithashree P
标签:AI安全, AI摘要, AV绕过, AWS VPC Flow Logs, Chat Copilot, CSV, FastAPI, Homebrew安装, JSON, LLM, OpenAI, Python, Scikit-learn, SEO: AI日志, SEO: 网络日志翻译, Syslog, Unmanaged PE, 严重性分类, 内存规避, 安全威胁识别, 异常检测, 无后门, 日志仪表盘, 日志可视化, 日志告警, 日志管道, 日志翻译, 日志解析, 结构化日志, 网络安全, 网络日志, 自然语言生成, 证书伪造, 逆向工具, 隐私保护