jeffersonferreira-ti/log_analyzer
GitHub: jeffersonferreira-ti/log_analyzer
一款基于 Python 的日志分析工具,通过启发式规则与风险评分自动化识别日志中的安全与运营问题。
Stars: 0 | Forks: 0

# Log Analyzer
**Ferramenta de análise de logs para suporte, operações e segurança**
*Parse. Detect. Understand.*
## 🧠 O Problema
Logs são uma das principais fontes de diagnóstico em sistemas, mas analisá-los manualmente é lento e ineficiente.
| Problema | Impacto |
|---|---|
| Alto volume de logs | Difícil identificar padrões |
| Falhas repetidas passam despercebidas | Incidentes não detectados |
| Atividade suspeita não analisada | Risco de segurança |
| Falta de estrutura | Troubleshooting demorado |
## 🚀 A Solução
O **Log Analyzer** automatiza a análise de logs, identificando padrões relevantes e transformando dados brutos em **insights acionáveis**.
Ele combina:
- parsing estruturado
- detecção de padrões
- sistema de pontuação de risco
- classificação final do cenário analisado
## ⚙️ Como Funciona
```
Logs → Ingestão → Parser → Heurísticas → Score → Classificação → JSON Report
```
## 🔍 Funcionalidades
### 📂 Log Ingestion
- leitura de `.log` e `.txt`
- múltiplos arquivos simultâneos
- tratamento de erros de leitura
### 🧩 Parsing Inteligente
Suporte a logs reais:
- Linux auth logs (`auth.log`, `secure`)
- Apache/Nginx logs
- Windows logs exportados (formato texto)
- fallback genérico
Extração de:
- timestamp
- nível (`INFO`, `WARNING`, `ERROR`, etc.)
- mensagem
- IP address
### 🧠 Heuristic Analysis
Detecta padrões como:
- `repeated_failed_logins`
- `repeated_errors`
- `suspicious_ip_activity`
- `critical_events_present`
- `excessive_warning_or_error_volume`
### 📊 Risk Scoring
Classificação baseada em score:
| Score | Classificação |
|---|---|
| 0-19 | NORMAL |
| 20-49 | ATTENTION |
| 50-79 | SUSPICIOUS |
| 80+ | CRITICAL |
## 🧪 Caso de Uso Real
### 📌 Cenário
Análise de um servidor com:
- múltiplas falhas de login SSH
- erro recorrente de aplicação
- evento crítico de sistema
- atividade suspeita de IP
### 📂 Logs analisados
- `auth.log`
- `system.log`
- `webapp.txt`
### 🔎 Resultado da análise
```
Loaded 3 log files (0 failed)
Parsed 17 log entries
Levels:
CRITICAL: 1
ERROR: 5
INFO: 5
NOTICE: 1
WARNING: 5
📊 Análise final
Total Score: 94
Classification: CRITICAL
🚨 Findings detectados
repeated failed logins
suspicious IP activity
repeated errors
critical system event
high volume of warnings/errors
```
### 🧠 Interpretação
O sistema identificou:
- tentativa de brute force (SSH)
- comportamento suspeito de IP
- erro recorrente de aplicação
- evento crítico de sistema (reboot)
- padrão de instabilidade geral
➡️ Conclusão: cenário de risco elevado → `CRITICAL`
## 📈 Exemplo de Execução
```
python main.py
```
### 🧾 JSON Report
Gerado automaticamente em:
`data/output/log_analysis_report.json`
Exemplo simplificado:
```
{
"total_files_loaded": 3,
"total_entries_parsed": 17,
"analysis_summary": {
"total_score": 94,
"classification": "CRITICAL"
}
}
```
### 🖥️ Uso via CLI
Execução padrão:
```
python main.py
```
Diretório customizado:
```
python main.py --source ./data/samples
```
Apenas resumo:
```
python main.py --summary-only
```
Sem relatório:
```
python main.py --no-report
```
Caminho customizado:
```
python main.py --output ./reports/analysis.json
```
## 🏗️ Arquitetura
```
log_analyzer/
├── app/
│ ├── ingestor/
│ ├── parser/
│ ├── analyzer/
│ ├── reporting/
│ └── models/
├── data/
│ ├── samples/
│ └── output/
├── main.py
├── config.py
└── requirements.txt
```
## ⚠️ Limitações
- não substitui SIEMs profissionais
- heurísticas simples (MVP)
- sem correlação avançada entre eventos
- parsing limitado a formatos suportados
## 🗺️ Roadmap
| Versão | Foco | Status |
|---|---|---|
| v1.0 | Ingestão + Parsing + Heurísticas | ✅ |
| v1.1 | Ajuste de scoring | ✅ |
| v1.2 | JSON + CLI | ✅ |
| v1.3 | Suporte a logs reais | ✅ |
| v2.0 | Enriquecimento de análise (IPs, mensagens) | 📋 |
| v2.1 | Monitoramento contínuo | 💡 |
## 🎯 Objetivo do Projeto
Demonstrar:
- análise de logs em ambiente real
- detecção de padrões operacionais e de segurança
- automação de troubleshooting
- raciocínio baseado em evidência
## 👨💻 Sobre o Desenvolvedor
Desenvolvido por Jefferson Ferreira
Log Analyzer · 2026
标签:AMSI绕过, Heuristic Analysis, Homebrew安装, IP信誉, Log Ingestion, Log Parser, Python, Risk Scoring, 威胁检测, 安全运营, 异常检测, 扫描框架, 故障排查, 文档结构分析, 无后门, 日志取证, 日志摄取, 日志解析, 模式识别, 系统日志, 结构化日志, 自动化分析, 证书伪造, 跨站脚本, 逆向工具, 风险评分