Condor2026/Diabolic_Peninsular_V17

GitHub: Condor2026/Diabolic_Peninsular_V17

一款面向西班牙半岛地区的被动型 OSINT 分析工具,自动抓取并分析 62 家报纸的犯罪新闻以检测区域性犯罪模式和事件关联。

Stars: 0 | Forks: 0

# 🔥 DIABOLIC PENINSULAR v5.3 ![Version](https://img.shields.io/badge/version-5.3-red) ![License](https://img.shields.io/badge/license-GPLv3-blue) ![Python](https://img.shields.io/badge/python-3.8+-blue) ![OSINT](https://img.shields.io/badge/OSINT-Pasivo%20%7C%20Analítico-blueviolet) ![Platform](https://img.shields.io/badge/platform-Linux%20%7C%20Termux-lightgrey) ![PRs Welcome](https://img.shields.io/badge/PRs-welcome-brightgreen) ![Analytical](https://img.shields.io/badge/Analytical-Yes-blue) [![Termux](https://img.shields.io/badge/Termux-Compatible-orange)](https://termux.com) [![Linux](https://img.shields.io/badge/Linux-Compatible-lightgrey)](https://linux.org) ![Communities](https://img.shields.io/badge/communities-15%20CCAA-brightgreen) ![Sources](https://img.shields.io/badge/sources-62%20periódicos-brightgreen) ![Last Commit](https://img.shields.io/github/last-commit/Condor2026/Diabolic_Peninsular_V17) ![Code Size](https://img.shields.io/github/languages/code-size/Condor2026/Diabolic_Peninsular_V17) ![Stars](https://img.shields.io/github/stars/Condor2026/Diabolic_Peninsular_V17?style=social) ![Forks](https://img.shields.io/github/forks/Condor2026/Diabolic_Peninsular_V17?style=social) **DIABOLIC Peninsular** 是一款被动且分析性的 OSINT 工具,用于监控**伊比利亚半岛西班牙的 62 家数字报纸**(从安达卢西亚到加利西亚,途经马德里、加泰罗尼亚、巴斯克地区等),以检测、分类和可视化犯罪模式。 它不存储个人数据,仅保存标题、日期以及按自治区划分的地理位置信息。核心理念:*“能力越大,责任越大”*。 ## 📌 目录 - [🔍 DIABOLIC 是做什么的?](#-qué-hace-diabolic) - [⚙️ 核心特性](#️-características-clave) - [🛠️ 技术与架构](#️-tecnología-y-arquitectura) - [📥 安装与使用](#-instalación-y-uso) - [🖥️ 终端模式(10 个命令)](#️-modo-terminal-10-comandos) - [🌐 交互式 Web 模式](#-modo-web-interactivo) - [🗺️ 监控来源](#️-fuentes-monitorizadas) - [📍 覆盖的自治区](#-comunidades-cubiertas) - [🧠 OSINT 类型与方法论](#-tipo-de-osint-y-metodología) - [⚖️ 道德、法律与数据保护](#️-ética-legalidad-y-protección-de-datos) - [🤝 贡献与未来](#-contribuciones-y-futuro) - [📜 许可证](#-licencia) ## 🔍 DIABOLIC 是做什么的? DIABOLIC 自动化了从伊比利亚半岛西班牙的当地和全国媒体**抓取事件新闻**的过程。你无需每天阅读数十份报纸,该工具可以: - **自动提取**与犯罪相关的新闻标题、日期、来源和地理位置(自治区)。 - **将**事件**分类**(盗窃、诈骗、贩毒、暴力、谋杀等)。 - 以 JSON 格式在本地**存储**数据,不保存任何个人数据。 - **分析**时间趋势(7 天、30 天、90 天)以及按自治区和犯罪类型的分布情况。 - **检测**事件之间的**关联**:相同区域、相近日期、相同的作案手法(如 vehicle bumping、butrón、escalo 等),这些可能指向同一个团伙。 - 通过带有柱状图和动态过滤器的交互式 Web 界面**可视化**结果。 - 将数据**导出**为 CSV 或 JSON 以供外部分析。 ## ⚙️ 核心特性 ### 🔁 User‑Agent 轮换 通过在每次请求中模拟不同的浏览器和版本来避免被报纸网站封锁。 ### 🧠 智能分页 自动尝试多达 12 种不同的分页格式(`/pagina/2`、`?page=2`、`?offset=2` 等),并记住适用于每个域名的格式。 ### 🔎 自动 URL 检测器 如果某家报纸的 URL 失效,系统会搜索替代路径(`/sucesos`、`/local`、`/tribunales`、`/actualidad/sucesos` 等)并更新配置。 ### 📊 高级犯罪分类 使用广泛的关键词列表,包括当地黑话(peta、falcon、vuelco、alunicero、butrón、intrusismo 等)。可轻松扩展。 ### 🔗 事件之间的关联 - **按类型和自治区**(例如:7 天内在马德里发生 5 起盗窃案)。 - **按作案手法**(检测“alunicero”或“butrón”等词汇的重复出现)。 - **时间频率**(事件/天)。 ### 🌐 交互式 Web 界面 - 按自治区和犯罪类型生成柱状图。 - 按时间段过滤(过去 7 天、30 天、90 天)。 - 最近 20 起事件的列表。 - 用于更新数据和导出 JSON/CSV 的按钮。 ### 🖥️ 完整的终端菜单 提供 10 个命令,允许你在不打开浏览器的情况下执行所有功能。 ## 🛠️ 技术与架构 - **语言**:Python 3.8+ - **Web 框架**:Flask(轻量级服务器) - **抓取**:Requests + BeautifulSoup4 - **存储**:本地 JSON(无外部数据库) - **模块化结构**: - `DetectorURLs`:负责验证和修正报纸的 URL。 - `GestorDatos`:加载、保存和处理事件。 - `ExtractorNoticias`:通过 User‑Agent 轮换和智能分页执行抓取。 - **终端色彩**:使用 ANSI 代码提供引人入胜的视觉体验。 ## 📥 安装与使用 ### 前提条件 - Python 3.8 或更高版本。 - pip (Python 包管理器)。 ### 手动安装 ``` git clone https://github.com/Condor2026/Diabolic_Peninsular_V17 cd Diabolic_Peninsular_V17 pip install -r requirements.txt python Diabolic_Peninsular_V17.py ``` ### 自动安装 (Termux / Linux) ``` chmod +x install.sh ./install.sh ``` ### 运行 启动时,系统会显示一个信息横幅并询问: - **1** → 终端模式(10 个命令)。 - **2** → Web 模式(服务器位于 `http://localhost:5014`)。 ## 🖥️ 终端模式(10 个命令) 进入主菜单后,你可以执行以下选项: | 命令 | 功能 | |---------|---------| | `[1]` | 🔍 搜索新闻(带自动 URL 检测) | | `[2]` | 📊 查看完整分析(趋势、分布情况) | | `[3]` | 🔗 查看事件之间的关联(模式与团伙) | | `[4]` | 📈 查看月度演变 | | `[5]` | 🌐 启动 Web 服务器 | | `[6]` | 📰 查看最近 20 起事件 | | `[7]` | 📥 导出数据 (JSON/CSV) | | `[8]` | 🔍 验证报纸(自动 URL 检测器) | | `[9]` | 📊 按类型查看分布(附带 ASCII 图表) | | `[10]` | 🗑️ 退出 | 每个选项都会与本地数据进行交互,让你无需打开浏览器即可探索各种模式。 ## 🌐 交互式 Web 模式 在启动时选择选项 `[2]`,将启动一个本地 Flask 服务器。你可以通过浏览器进行以下操作: - 查看全局统计数据(总计、过去 7/30/90 天)。 - 按时间段进行过滤。 - 可视化展示各自治区和各类型事件分布情况的柱状图。 - 查询最近 20 起事件的列表。 - 直接通过网页更新数据库(点击 **ACTUALIZAR** 按钮)。 - 导出为 JSON 或 CSV。 该界面已针对移动设备和桌面设备进行了优化。 ## 🗺️ 监控来源 该工具包含了来自伊比利亚半岛西班牙各地的 **62 家报纸**,其中包括: - **全国性媒体**:El País、El Mundo、ABC、La Razón、El Periódico、20 Minutos、El Español、El Confidencial、OK Diario、elDiario.es、Público、Huffington Post。 - **安达卢西亚**:Diario de Sevilla、Diario de Cádiz、Málaga Hoy、Granada Hoy、Ideal、Diario Sur、Córdoba、Huelva Información、Diario de Almería、Jaén。 - **加泰罗尼亚**:La Vanguardia、El Periódico (Cataluña)、Ara、El Nacional.cat、NacióDigital、Diari de Girona、Segre、Diari de Tarragona。 - **马德里**:El Mundo (Madrid)、ABC (Madrid)、La Razón (Madrid)、20 Minutos Madrid、Telemadrid。 - **瓦伦西亚自治区**:Levante-EMV、Las Provincias、Información (Alicante)、El Periódico Mediterráneo。 - **加利西亚**:La Voz de Galicia、Faro de Vigo、El Correo Gallego、Diario de Pontevedra。 - **巴斯克地区**:El Correo、Diario Vasco、Deia。 - **卡斯蒂利亚-莱昂**:El Norte de Castilla、Diario de León、Diario de Burgos、La Gaceta de Salamanca。 - **阿拉贡**:Heraldo de Aragón、El Periódico de Aragón。 - **阿斯图里亚斯**:La Nueva España、El Comercio。 - **坎塔布里亚**:El Diario Montañés。 - **拉里奥哈**:La Rioja。 - **穆尔西亚**:La Verdad、La Opinión de Murcia。 - **纳瓦拉**:Diario de Navarra、Noticias de Navarra。 - **埃斯特雷马杜拉**:Hoy (Extremadura)、El Periódico Extremadura。 自动 URL 检测器负责修正地址中的变更。 ## 📍 覆盖的自治区 - 安达卢西亚 - 阿拉贡 - 阿斯图里亚斯 - 坎塔布里亚 - 卡斯蒂利亚-莱昂 - 卡斯蒂利亚-拉曼恰 - 加泰罗尼亚 - 马德里自治区 - 瓦伦西亚自治区 - 埃斯特雷马杜拉 - 加利西亚 - 拉里奥哈 - 穆尔西亚 - 纳瓦拉 - 巴斯克地区 此外,全国性报纸允许追踪影响整个半岛领土的新闻。 ## 🧠 OSINT 类型与方法论 DIABOLIC 被归类为**被动和分析性 OSINT**: - **被动**:因为它不与报纸的系统进行超出普通用户 HTTP 请求之外的交互。它不进行注入,不破坏访问权限,也不使用凭证。 - **分析性**:因为它不仅限于收集信息;还会处理数据以提取**地理模式(自治区)、时间模式(每日、每月的演变)和关联模式(事件之间的联系)**。 ### 工作流程 1. **获取**:在遵守等待时间和 User-Agents 的前提下,下载每份报纸的事件页面。 2. **解析**:提取标题、日期,并通过关键词比对检测位置(自治区)。 3. **分类**:根据关键词为每个事件标记犯罪类型(盗窃、诈骗等)。 4. **存储**:将元数据保存在本地 JSON 文件中,不含个人数据。 5. **分析**:生成统计数据、时间模式和关联。 6. **可视化**:在终端或网页上显示结果。 ### 关联检测(选项 3) - 将过去 30 天内按**类型 + 自治区**对事件进行分组。 - 如果在同一自治区的相同类型事件达到 **3 起或更多**,则将其作为模式显示,并计算频率(事件/天)。 - 搜索作案手法的关键词(`alunicero`、`butrón`、`escalo` 等),将共享相同手法的事件进行分组,从而推测出可能存在的团伙。 ## ⚖️ 道德、法律与数据保护 ### 法规遵从 - **RGPD / LOPDGDD**:DIABOLIC 不处理个人数据。它仅存储元数据(标题、日期、自治区、类型、来源)。因此,它不属于这些法律的适用范围。 - **知识产权**:它不全文转载新闻内容;仅提取标题和元数据。发出的请求与人类读者完全相同,并遵守 `robots.txt` 和 rate limiting。 ### 道德原则 - **透明度**完全开放源代码,任何人都可以审计它的功能及其存储的数据。 - **不作监控**:不对个人进行画像分析,也不存储可用于识别个人身份的信息。 - **责任**:用户对如何使用该工具负全部责任。启动横幅包含相关警告及蜘蛛侠的核心理念。 ### 免责声明 本工具按“原样”提供,不保证不间断运行。引入任何有害功能(如收集个人数据、暗中监控)的修改行为,均由修改者自行承担全部责任。 ## 📜 许可证 本项目基于 **GNU General Public License v3.0 (GPLv3)** 许可证。 这意味着: - 你可以自由使用、学习、分享和修改该软件。 - 如果你分发修改后的版本,**必须同样基于此许可证发布**。 - **你不能将该软件转变为闭源专有软件**;任何衍生作品都必须保持开源。 - 本软件按“原样”提供,不提供任何保证(查看 [`LICENSE`](LICENSE) 文件了解更多详情)。 请查看 `LICENSE` 文件获取完整的许可证文本。 ⭐ **如果 DIABOLIC 对你有帮助,请考虑在仓库中留下 Star 并分享此项目。让我们共同推动 OSINT 变得更加道德且易于访问!**
标签:ESC4, OSINT, 代码示例, 字符串匹配, 实时处理, 情报收集, 数据分析, 漏洞研究, 逆向工具