Condor2026/Diabolic_v17
GitHub: Condor2026/Diabolic_v17
DIABOLIC 是一款开源 OSINT 工具,通过自动化抓取和分析巴利阿里群岛多家报纸的事件新闻来检测犯罪模式与事件关联。
Stars: 0 | Forks: 0
# DIABOLIC Baleares v5.3
[](https://github.com/Condor2026/Diabolic_v17)

[](https://python.org)
[](https://es.wikipedia.org/wiki/OSINT)
[](https://termux.com)
[](https://linux.org)
[](https://es.wikipedia.org/wiki/Web_scraping)






**DIABOLIC Baleares** 是一款被动且具有分析功能的 OSINT 工具,旨在**自动监控巴利阿里群岛的 18 家数字报纸**,提取并处理事件新闻,以检测犯罪模式、地理趋势以及事件之间的关联。
它的诞生源于一个明确的理念:*“能力越大,责任越大”*。因此,其设计优先考虑透明度、道德规范和隐私保护。
## 📌 目录
- [🔍 DIABOLIC 是做什么的?](#-qué-hace-diabolic)
- [⚙️ 核心功能](#️-características-clave)
- [🛠️ 技术与架构](#️-tecnología-y-arquitectura)
- [⚖️ Web Scraping:法律框架](#️-web-scraping-marco-legal)
- [📥 安装与使用](#-instalación-y-uso)
- [🖥️ 终端模式(10 个命令)](#️-modo-terminal-10-comandos)
- [🌐 交互式 Web 模式](#-modo-web-interactivo)
- [📰 监控来源](#-fuentes-monitorizadas)
- [🧠 OSINT 类型与方法论](#-tipo-de-osint-y-metodología)
- [⚖️ 道德、法律与数据保护](#️-ética-legalidad-y-protección-de-datos)
- [🤝 贡献与未来](#-contribuciones-y-futuro)
- [📜 许可证](#-licencia)
## 🔍 DIABOLIC 是做什么的?
DIABOLIC 自动化了从巴利阿里群岛当地媒体**抓取事件新闻**的过程。无需每天阅读数十份报纸,该工具可以:
- **提取**与犯罪相关的新闻标题、日期、来源和地理位置。
- **分类**将事件分类(盗窃、诈骗、贩毒、暴力、谋杀、非法旅游侵入等)。
- **存储**以 JSON 格式在本地存储数据,不保存任何个人数据。
- **分析**时间趋势(7 天、30 天、90 天)以及按岛屿和犯罪类型分布的情况。
- **检测关联**检测事件之间的关联:同一区域、相近日期、相同的作案手法(砸车窗盗窃、破墙盗窃、入室盗窃等),这些可能指向同一个犯罪团伙。
- **可视化**通过带有柱状图和动态过滤器的交互式 Web 界面将结果可视化。
- **导出**将数据导出为 CSV 或 JSON 以供外部分析。
## ⚙️ 核心功能
| 功能 | 描述 |
|----------------|-------------|
| 🔁 User‑Agent 轮换 | 通过模拟不同的浏览器和版本来避免被封禁。 |
| 🧠 智能分页 | 测试 12 种分页格式并记住有效的那一种。 |
| 🔎 自动 URL 检测器 | 如果失败,会自动搜索备用路径(/sucesos、/local、/tribunales 等)。 |
| 📊 高级分类 | 巴利阿里群岛词汇库:peta、falcon、vuelco、alunicero、butrón、非法侵入等。 |
| 🔗 事件间关联 | 按类型/岛屿、作案手法、时间频率关联。 |
| 🌐 交互式 Web 界面 | 图表、过滤器、导出功能。 |
| 🖥️ 完整的终端菜单 | 包含 10 个命令。 |
## 🛠️ 技术与架构
- **语言**:Python 3.8+
- **Web 框架**:Flask
- **Scraping**:Requests + BeautifulSoup4
- **存储**:本地 JSON
- **模块化结构**:
- `DetectorURLs`:验证并更正 URL。
- `GestorDatos`:加载、保存和处理事件。
- `ExtractorNoticias`:使用 User‑Agent 轮换和智能分页进行 scraping。
- **终端颜色**:ANSI 代码。
## ⚖️ Web Scraping:法律框架
DIABOLIC Baleares 进行的 Web Scraping 是**完全合法且符合道德的**,原因如下:
1. **公开来源**:仅访问已索引且无需身份验证即可访问的内容。不破坏付费系统或受限区域。
2. **遵守 RGPD / LOPDGDD**:不提取、存储或处理个人数据(姓名、地址、电话、电子邮件、IP、cookies)。仅存储匿名元数据:新闻标题、日期、大致岛屿、犯罪类型和来源。
3. **尊重使用条款**:该工具尊重每个站点的 `robots.txt` 文件(可配置),并且不会通过大量请求使服务器过载(限制频率和页面数量)。
4. **不重新发布内容**:不完全复制文章,仅提取标题和元数据用于分析,并始终注明原始来源。
5. **合法使用**:目的严格限于学术、新闻、犯罪学研究或社区预防,非盈利且不用于大规模监控。
6. **完全透明**:代码是开源且可审计的,允许验证没有进行有害的操作。
## 📥 安装与使用
### 在 Termux 中 (Android)
```
pkg update && pkg upgrade -y
pkg install python git -y
pip install requests beautifulsoup4 flask
git clone https://github.com/Condor2026/Diabolic_v17
cd Diabolic_v17
python Diabolic_v17.py
```
在 Linux 中 (Debian/Ubuntu)
```
sudo apt update
sudo apt install python3 python3-pip git -y
pip3 install requests beautifulsoup4 flask
git clone https://github.com/Condor2026/Diabolic_v17
cd Diabolic_v17
python3 Diabolic_v17.py
```
🖥️ 终端模式(10 个命令)
运行 Diabolic_v17.py 后,会显示一个包含以下选项的菜单:
```
╔════════════════════════════════════════════════════╗
║ M E N Ú P R I N C I P A L ║
╚════════════════════════════════════════════════════╝
[1] 🔍 Buscar noticias
[2] 📊 Ver análisis completo
[3] 🔗 Ver conexiones entre incidentes
[4] 📈 Ver evolución mensual
[5] 🌐 Iniciar servidor web
[6] 📰 Ver últimos 20 incidentes
[7] 📥 Exportar datos (JSON/CSV)
[8] 🔍 Verificar periódicos
[9] 📊 Ver distribución por tipo
[0] 🗑️ Salir
```
每个选项都会执行相应的操作并在终端中显示结果。
🌐 交互式 Web 模式
选项 [5] 会启动一个本地 Flask 服务器(默认地址为 http://localhost:5013)。在浏览器中,你可以:
· 查看按岛屿和犯罪类型划分的交互式柱状图。
· 按时间段(7 天、30 天、90 天)进行过滤。
· 查询事件列表。
· 一键将数据导出为 CSV 或 JSON 格式。
📰 监控来源
该工具会抓取巴利阿里群岛的 18 家数字报纸,包括:
· 马略卡岛:Diario de Mallorca、Última Hora、Mallorca Diario、Crónica Balear、Noticias Mallorca、Mallorca Confidencial、El Mundo – Baleares、El País – Baleares。
· 梅诺卡岛:Menorca Info、Menorca Al Día、Es Diari Menorca、Menorca Esportiu。
· 伊维萨岛:Diario de Ibiza、Periódico de Ibiza、Noudiari、La Voz de Ibiza。
· 福门特拉岛:Formentera Avui、Formentera Digital。
完整列表可以在脚本内部进行查看或编辑(PERIODICOS_BASE)。
🧠 OSINT 类型与方法论
· 被动 OSINT:除了普通用户的正常浏览行为外,不与报纸系统进行其他交互。
· 选择性提取:仅收集事件(警务、司法、公共安全)信息。
· 匿名化:不存储涉案人员的个人数据,仅记录地点、日期和犯罪类型。
· 分析导向:寻找规律以了解巴利阿里群岛的犯罪情况,尤其是非法旅游侵入、盗窃和贩毒。
⚖️ 道德、法律与数据保护
DIABOLIC Baleares 严格遵守西班牙和欧洲的法律:
· 仅访问公开内容,无需身份验证。
· 不存储个人信息(姓名、DNI、地址、IP、cookies)。
· 代码开源且透明。
· 建议仅出于学术、新闻或合法犯罪调查目的使用该工具。
⚠️ 法律警告
此工具仅供教育和合法研究目的使用。不得用于骚扰、人肉搜索、非法活动或侵犯个人隐私。作者不对滥用行为负责。用户对遵守其所在国家/地区的法律负全部责任。
## 📜 许可证
本项目基于 **GNU General Public License v3.0 (GPLv3)** 许可证。
请查看 [`LICENSE`](LICENSE) 文件以获取完整的许可证文本。
🙏 致谢
· BeautifulSoup4 – 用于 Web Scraping。
· Flask – 用于 Web 界面。
· 灵感来源:Sherlock、Maigret 等 OSINT 项目。
· 巴利阿里群岛的 OSINT 研究社区。
⭐ 如果你喜欢这个项目,请不要忘记在 GitHub 上给它点个 Star!
标签:ESC4, FOFA, OSINT, Python, 字符串匹配, 实时处理, 情报收集, 无后门, 漏洞研究, 逆向工具