Condor2026/keltic_kraken
GitHub: Condor2026/keltic_kraken
一款面向爱尔兰犯罪情报监测的开源平台,通过自动扫描和分类多家新闻来源,为用户提供实时犯罪态势数据与分析能力。
Stars: 0 | Forks: 0
# 📄 README.md
## 📋 目录 - [什么是 KELTIC KRAKEN?](#qué-es-keltic_kraken) - [主要功能](#características-principales) - [系统要求](#requisitos-del-sistema) - [分步安装指南](#instalación-paso-a-paso) - [首次使用 - 快速指南](#primer-uso---guía-rápida) - [终端菜单命令](#comandos-del-menú-terminal) - [Web 仪表板](#dashboard-web) - [覆盖范围](#cobertura-geográfica) - [项目结构](#estructura-del-proyecto) - [疑难解答](#solución-de-problemas) - [常见问题](#preguntas-frecuentes) - [许可证](#licencia) - [作者](#autor) ## 什么是 KELTIC KRAKEN? KELTIC KRAKEN 是一个专门为**爱尔兰**设计的**开源**犯罪情报平台。该系统: | # | 动作 | 描述 | |---|--------|-------------| | 1 | **扫描** | 85+ 家爱尔兰报纸(全国、地区和地方) | | 2 | **检测** | 与有组织犯罪、毒品交易和暴力相关的新闻 | | 3 | **分类** | 按类型对每个事件进行分类(毒品、谋杀、帮派暴力等) | | 4 | **地理定位** | 按郡划分(都柏林、科克、戈尔韦、贝尔法斯特等) | | 5 | **分析** | 实时生成统计数据和交互式图表 | | 6 | **导出** | 提供 JSON、CSV 或 HTML 格式的数据,用于外部分析 | ### 🎯 适用人群? | 用户 | 优势 | Emoji | |---------|-----------|-------| | **记者** | 获取整合后的犯罪信息来源 | 📰 | | **研究人员** | 获取用于趋势分析的历史数据 | 🔬 | | **犯罪学家** | 获取用于学术研究的材料 | 🎓 | | **安全部队** | 了解犯罪活动概况(合乎道德的使用) | 👮 | | **公民** | 了解所在社区的态势感知 | 🏡 | | **开发者** | 获取用于集成的 API 和数据 | 💻 | ## 主要功能 ### 🔒 防封锁 | 功能 | 数值 | 描述 | |----------------|-------|-------------| | **User-Agents** | 150+ | 持续轮换浏览器标识 | | **重试次数** | 3 | 在标记为不可用之前,每个来源的重试次数 | | **延迟** | 0.8-2.0s | 请求之间的随机等待时间 | | **Timeout** | 25s | 单次请求限制 | | **Session** | 持久化 | 在请求之间保持 Cookies 和 Headers | | **Retry** | 自动 | 失败时自动进行指数退避 | ### 🔧 自动修复 | 功能 | 描述 | |----------------|-------------| | **自动发现 URL** | 如果某个 URL 失败,会自动搜索正确的 URL | | **URL 缓存** | 保存找到的 URL 以备将来运行使用 | | **智能分页** | 自动检测分页模式 | | **回退路径** | 50+ 个可供尝试的替代路径 | ### 🖥️ 界面 | 功能 | 描述 | |----------------|-------------| | **终端** | 包含 12 个命令的菜单,支持颜色和进度条 | | **Web 仪表板** | 4 个交互式图表 (Chart.js) | | **双语** | 完全支持西班牙语和英语 | | **响应式** | 适用于手机、平板电脑和桌面设备 | ### 📊 数据 | 功能 | 数值 | |----------------|-------| | **来源** | 85+ 家报纸 | | **郡** | 32 个(全爱尔兰) | | **犯罪类型** | 9 个类别 | | **关键词** | 100+ 个搜索词 | ### 📥 导出 | 格式 | 用途 | 兼容性 | |---------|-----|----------------| | **JSON** | 完整数据 | 所有应用程序 | | **CSV** | 电子表格 | Excel, Google Sheets, LibreOffice | | **HTML** | 专业报告 | 任何浏览器 | ## 系统要求 ### 最低配置与推荐配置 | 组件 | 最低要求 | 推荐 | |------------|--------|-------------| | **操作系统** | Windows 10 / macOS 11 / Linux | Windows 11 / macOS 14 / Ubuntu 22.04 | | **Python** | 3.8 | 3.11+ | | **RAM** | 512 MB | 1 GB | | **存储空间** | 100 MB | 500 MB | | **互联网** | 1 Mbps | 10 Mbps | ### 检查 Python ``` # Linux / Mac python3 --version # Windows python --version ``` **如果你没有安装 Python:** [下载 Python 3.11+](https://www.python.org/downloads/) ## 分步安装指南 ### 🐧 Linux / 🍎 Mac ``` # 步骤 1:克隆仓库 git clone https://github.com/Condor2026/keltic_kraken cd keltic_kraken # 步骤 2:创建虚拟环境 python3 -m venv venv source venv/bin/activate # 步骤 3:安装依赖 pip install --upgrade pip pip install -r requirements.txt # 步骤 4:验证安装 python3 -c "import requests, bs4, flask; print('✅ Todo correcto')" # 步骤 5:运行 python3 keltic_kraken.py ``` ### 🪟 Windows ``` # 步骤 1:克隆仓库 git clone https://github.com/Condor2026/keltic_kraken cd keltic_kraken # 步骤 2:创建虚拟环境 python -m venv venv venv\Scripts\activate # 步骤 3:安装依赖 pip install --upgrade pip pip install -r requirements.txt # 步骤 4:验证安装 python -c "import requests, bs4, flask; print('✅ Todo correcto')" # 步骤 5:运行 python keltic_kraken.py ``` ### 🐳 Docker ``` # 构建镜像 docker build -t keltic_kraken . # 运行容器 docker run -p 5014:5014 keltic_kraken # 或者使用 docker-compose docker-compose up -d ``` ## 首次使用 - 快速指南 当你**首次**运行时,请按照以下步骤操作: ### 1️⃣ 选择语言 ``` 🌍 SELECCIONE IDIOMA / SELECT LANGUAGE ┌──────────────────────────────────────────────────┐ │ [1] Español │ │ [2] English │ └──────────────────────────────────────────────────┘ ➤ Opción: 1 ``` ### 2️⃣ 选择运行模式 ``` ┌────────────────────────────────────────────────────┐ │ ¿Cómo deseas ejecutar? │ ├────────────────────────────────────────────────────┤ │ [1] Modo Terminal (recomendado para análisis) │ │ [2] Modo Web (dashboard con gráficos) │ └────────────────────────────────────────────────────┘ ➤ Elige: 1 ``` ### 3️⃣ 检查来源(必需) ``` ➤ Opción: 8 ``` **执行的操作:** - ✅ 逐一检查 85+ 个来源 - ✅ 将有效的标记为活跃 - ❌ 将失败的标记为不活跃 - 🔍 对失效的 URL 应用自动发现 - 💾 将找到的 URL 保存到缓存中 **预期结果:** ``` 📊 RESULTADOS: Fuentes activas: 68 de 85 Auto-discovery aplicado: 12 URLs encontradas Caché guardada para futuras ejecuciones ``` ### 4️⃣ 搜索犯罪记录 ``` ➤ Opción: 1 ``` **执行的操作:** - 扫描所有活跃的来源 - 搜索与犯罪相关的关键词 - 提取标题、日期和位置 - 按犯罪类型分类 - 保存到本地数据库 **你将看到:** ``` 🔪 KELTIC KRAKEN - ESCANEANDO IRLANDA ================================================================================ 📰 Irish Times (1/68) 📍 Condado: Dublin 📄 Página 1... ✓ 24 encontrados 📄 Página 2... ✓ 18 encontrados 📄 Página 3... ✓ 12 encontrados 📊 Total en esta fuente: 54 incidentes ``` ### 5️⃣ 查看结果 ``` ➤ Opción: 6 ``` ``` 📰 ÚLTIMOS 20 INCIDENTES ================================================================================ 1. Man arrested after €500k cocaine seizure in Dublin 📅 2026-06-12 | 📍 Dublin | 📰 Irish Times | 🔪 DRUGS 2. Two charged over Kinahan-linked shooting in Cork 📅 2026-06-11 | 📍 Cork | 📰 Irish Examiner | 🔪 GANG_VIOLENCE 3. Gardaí launch operation after body found in Galway 📅 2026-06-11 | 📍 Galway | 📰 RTÉ | 🔪 MURDER ``` ### 6️⃣ (可选)Web 仪表板 ``` ➤ Opción: 5 ``` 打开浏览器访问:**http://localhost:5014** ## 终端菜单命令 | 选项 | 命令 | 执行操作 | 使用时机 | |--------|---------|----------|--------| | **1** | 🔍 搜索犯罪记录 | 扫描所有活跃的来源 | 每天 | | **2** | 📊 完整分析 | 显示详细统计数据 | 搜索后 | | **3** | 🔗 模式分析 | 检测犯罪高发区 | 每周 | | **4** | 📈 趋势演变 | 时间趋势图 | 每月 | | **5** | 🌐 Web 服务器 | 在 localhost 上启动仪表板 | 按需 | | **6** | 📰 最近 20 条 | 列出近期事件 | 快速查看 | | **7** | 📥 导出 | 保存为 JSON/CSV/HTML | 用于分享 | | **8** | 🔍 检查来源 | 更新来源状态 | 每周 | | **9** | 📊 分布情况 | 各类型百分比 | 搜索后 | | **10** | 📈 高级分析 | 密度、趋势等指标 | 深度分析 | | **11** | 🧹 清理 | 删除重复项 | 发现重复数据时 | | **12** | 🗑️ 退出 | 关闭应用程序 | 完成时 | ### 📋 每日流程示例 ``` # 周一上午 9:00 ➤ 8 # Verificar fuentes ➤ 1 # Buscar crímenes nuevos ➤ 6 # Ver últimos incidentes ➤ 2 # Ver estadísticas ➤ 5 # (opcional) Abrir dashboard web ``` ## Web 仪表板 当你运行**选项 5** 时,会在 `http://localhost:5014` 启动一个 Web 服务器 ### 📊 图表 1:各郡事件统计(柱状图) | 元素 | 描述 | |----------|-------------| | **类型** | 垂直柱状图 | | **数据** | 每个郡的事件数量 | | **交互** | 鼠标悬停可查看确切数字 | | **用途** | 识别热点区域 | **揭示内容:** - 都柏林通常位居榜首(人口越多 = 犯罪越多) - 科克位居第二 - 犯罪活动的地理分布模式 ### 🥧 图表 2:犯罪类型(环形图) | 类型 | 颜色 | 描述 | |------|-------|-------------| | 💊 毒品 | 深红色 | 毒品交易、查扣、走私 | | 🔫 帮派暴力 | 红色 | 帮派暴力 (Kinahan, Hutch) | | 💀 谋杀 | 黑色 | 谋杀和过失杀人 | | 👮 警察行动 | 蓝色 | 警方行动 | | 👊 人身攻击 | 橙色 | 袭击 | | 💰 抢劫 | 黄色 | 抢劫和盗窃 | | 🕴️ 有组织犯罪 | 紫色 | 有组织犯罪 | | 🔪 武器 | 石榴红 | 涉及武器的犯罪 | | ❓ 其他 | 灰色 | 其他类型 | ### 📈 图表 3:月度趋势(折线图) | 元素 | 描述 | |----------|-------------| | **类型** | 带填充的折线图 | | **数据** | 逐月演变趋势 | | **趋势** | 视觉上的上升/下降 | | **用途** | 检测季节性规律 | **解答的问题:** - 犯罪率是在上升还是下降? - 在特定月份是否有高峰? - 今年与去年相比如何? ### 📊 图表 4:热门来源(水平条形图) | 元素 | 描述 | |----------|-------------| | **类型** | 水平条形图 | | **数据** | 最活跃的报纸 | | **排序** | 从高到低 | | **用途** | 识别提供最多信息的来源 | ### 📋 事件列表 每张卡片显示: - 新闻的**完整标题** - 发布**日期** - 发生所在的**郡** - **来源**(报纸) - 带有颜色标识的犯罪**类型** ### 🎛️ Web 控制选项 | 按钮 | 功能 | |-------|---------| | 🔄 更新数据 | 扫描来源并更新 | | 📥 JSON | 下载 JSON 格式的数据 | | 📥 CSV | 下载 CSV 格式 | | 📄 HTML 报告 | 生成专业报告 | | 全部 | 所有事件 | | 7天 | 最近 7 天 | | 30天 | 最近 30 天 | | 90天 | 最近 90 天 | ## 覆盖范围 ### 爱尔兰共和国(26 个郡) | 郡 | 来源 | 主要媒体 | |---------|---------|-------------------| | **Dublin** | 7 | Irish Times, Irish Independent, RTÉ, Dublin Live | | **Cork** | 5 | Irish Examiner, Cork Beo, Cork Independent | | **Galway** | 4 | Galway Beo, Galway Advertiser, Connacht Tribune | | **Limerick** | 4 | Limerick Leader, Limerick Post | | **Kerry** | 4 | Kerryman, Radio Kerry | | **Donegal** | 4 | Donegal Daily, Donegal News | | **Mayo** | 4 | Mayo News, Connaught Telegraph | | **Wexford** | 4 | Wexford People, Wexford Echo | | **Kildare** | 4 | Kildare Now, KFM Radio | | **Tipperary** | 4 | Tipperary Live, Tipp FM | | **Louth** | 4 | Louth Live, LMFM | | **Waterford** | 3 | Waterford News, Waterford Live | | **Clare** | 4 | Clare Champion, Clare FM | | **Sligo** | 3 | Sligo Champion, Ocean FM | | **其他** | 2-3 | 当地媒体 | ### 北爱尔兰(6 个郡) | 郡 | 来源 | 主要媒体 | |---------|---------|-------------------| | **Antrim (Belfast)** | 5 | Belfast Telegraph, Irish News, Belfast Live | | **Derry/Londonderry** | 3 | Derry Journal, Derry Now | | **Down** | 2 Down Recorder, Newry Reporter | | **Tyrone** | 2 | Tyrone Times, Ulster Herald | | **Armagh** | 2 | Armagh I, Lurgan Mail | | **Fermanagh** | 2 | Fermanagh Herald, Impartial Reporter | ### 📊 总计 | 区域 | 郡 | 来源 | |--------|----------|---------| | 爱尔兰共和国 | 26 | ~65 | | 北爱尔兰 | 6 | ~20 | | **总计** | **32** | **85+** | ## 项目结构 ``` keltic-kraken/ │ ├── 📄 keltic_kraken.py # Script principal (2250+ líneas) ├── 📄 requirements.txt # Dependencias Python ├── 📄 README.md # Este documento ├── 📄 LICENSE # GPL v3 │ ├── 📊 keltic_kraken_ireland.json # Base de datos de incidentes ├── 💾 keltic_kraken_backup.json # Copia de seguridad automática ├── 🗺️ url_cache_ireland.json # Caché de URLs descubiertas ├── 📡 estado_fuentes_ireland.json # Estado de cada fuente │ ├── 📤 keltic_kraken_export.json # Exportación manual (JSON) ├── 📤 keltic_kraken_export.csv # Exportación manual (CSV) ├── 📤 keltic_kraken_report.html # Exportación manual (HTML) │ └── 📁 docs/ # Documentación extra ├── usage.md ├── api.md └── screenshots/ ``` ### 自动生成的文件 | 文件 | 生成时机 | 包含内容 | |---------|--------|--------------| | `keltic_kraken_ireland.json` | 首次运行 | 所有事件记录 | | `url_cache_ireland.json` | 自动发现时 | 替代的 URL | | `estado_fuentes_ireland.json` | 选项 8 | 活跃/不活跃状态 | | `keltic_kraken_backup.json` | 每次保存时 | 数据备份 | ### ❓ 这合法吗? **是的。** 该系统: - 仅访问**公开**数据 - 遵守请求之间的延迟 - 不会使服务器过载 - 不破坏安全措施 - 仅使用报纸的公开板块 ### ❓ 我可以将其用于其他国家吗? 该系统专为爱尔兰设计,但可以通过以下方式进行改编: 1. 修改 `FUENTES_BASE`(报纸列表) 2. 修改 `PALABRAS_CLAVE_CRIMEN`(本地搜索词汇) 3. 修改 `CONDADOS_IRLANDA`(替换为该国的地区) 4. 修改 `TIPOS_CRIMEN`(本地犯罪类别) ### ❓ 数据保存在哪里? 保存在 `keltic_kraken_ireland.json`(可读的 JSON 格式)中 ### ❓ 我可以导出数据吗? **是的,支持三种格式:** - `➤ 7` → 导出为 JSON、CSV 和 HTML - Web 端的 📥 JSON 按钮 - Web 端的 📥 CSV 按钮 - Web 端的 📄 HTML 报告 按钮 ### ❓ 会消耗大量资源吗? **不会。** 典型使用情况: - RAM:~200-500 MB - CPU:抓取期间约占 10-20% - 存储:每月约 10-50 MB 数据 ### ❓ 支持移动端吗? **支持。** Web 仪表板具有响应式设计,适用于: - iPhone (iOS) - Android - 平板电脑 - iPad ## 许可证 **GNU General Public License v3.0** ``` Copyright (C) 2026 Condor2026 / SpectrumSecurity This program is free software: you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation, either version 3 of the License, or (at your option) any later version. This program is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License for more details. You should have received a copy of the GNU General Public License along with this program. If not, see .
```
### 🔒 权限
| 操作 | 允许 |
|--------|-----------|
| ✅ 商业用途 | 是 |
| ✅ 修改 | 是 |
| ✅ 分发 | 是 |
| ✅ 私人使用 | 是 |
| ❌ 担责 | 否 |
| ❌ 保证 | 否 |
## 作者
**Condor2026** · **SpectrumSecurity**
| 平台 | 链接 |
|------------|--------|
| GitHub | [@Condor2026](https://github.com/Condor2026) |
| 项目 | [KELTIC KRAKEN](https://github.com/Condor2026/keltic-kraken) |
| Email | spectrumsecurity@proton.me |
## 致谢
- 感谢报道有组织犯罪的爱尔兰记者(这是一项危险而勇敢的工作)
- 感谢开源社区 (requests, beautifulsoup, flask, chart.js)
- 感谢使这一切成为可能的库的开发者
- 感谢你能够合乎道德和负责任地使用此工具
## ⭐ 给我点个 Star
如果这个项目对你有帮助,请考虑在 GitHub 上给它点个 ⭐。这能让我知道我正走在正确的道路上。
```
# 如果你喜欢这个项目:
# 1. 在 GitHub 上点击 ⭐
# 2. 与可能需要它的同事分享
# 3. 报告 bug 或提出改进建议
```
🔪 KELTIC KRAKEN v3.0
爱尔兰犯罪情报平台
🇮🇪 实时监控全境 32 个郡的毒品交易、帮派暴力和有组织犯罪 🇮🇪
150+ 轮换 User-Agents · 自动发现 URL · 防封锁系统 · 交互式仪表板
## 📋 目录 - [什么是 KELTIC KRAKEN?](#qué-es-keltic_kraken) - [主要功能](#características-principales) - [系统要求](#requisitos-del-sistema) - [分步安装指南](#instalación-paso-a-paso) - [首次使用 - 快速指南](#primer-uso---guía-rápida) - [终端菜单命令](#comandos-del-menú-terminal) - [Web 仪表板](#dashboard-web) - [覆盖范围](#cobertura-geográfica) - [项目结构](#estructura-del-proyecto) - [疑难解答](#solución-de-problemas) - [常见问题](#preguntas-frecuentes) - [许可证](#licencia) - [作者](#autor) ## 什么是 KELTIC KRAKEN? KELTIC KRAKEN 是一个专门为**爱尔兰**设计的**开源**犯罪情报平台。该系统: | # | 动作 | 描述 | |---|--------|-------------| | 1 | **扫描** | 85+ 家爱尔兰报纸(全国、地区和地方) | | 2 | **检测** | 与有组织犯罪、毒品交易和暴力相关的新闻 | | 3 | **分类** | 按类型对每个事件进行分类(毒品、谋杀、帮派暴力等) | | 4 | **地理定位** | 按郡划分(都柏林、科克、戈尔韦、贝尔法斯特等) | | 5 | **分析** | 实时生成统计数据和交互式图表 | | 6 | **导出** | 提供 JSON、CSV 或 HTML 格式的数据,用于外部分析 | ### 🎯 适用人群? | 用户 | 优势 | Emoji | |---------|-----------|-------| | **记者** | 获取整合后的犯罪信息来源 | 📰 | | **研究人员** | 获取用于趋势分析的历史数据 | 🔬 | | **犯罪学家** | 获取用于学术研究的材料 | 🎓 | | **安全部队** | 了解犯罪活动概况(合乎道德的使用) | 👮 | | **公民** | 了解所在社区的态势感知 | 🏡 | | **开发者** | 获取用于集成的 API 和数据 | 💻 | ## 主要功能 ### 🔒 防封锁 | 功能 | 数值 | 描述 | |----------------|-------|-------------| | **User-Agents** | 150+ | 持续轮换浏览器标识 | | **重试次数** | 3 | 在标记为不可用之前,每个来源的重试次数 | | **延迟** | 0.8-2.0s | 请求之间的随机等待时间 | | **Timeout** | 25s | 单次请求限制 | | **Session** | 持久化 | 在请求之间保持 Cookies 和 Headers | | **Retry** | 自动 | 失败时自动进行指数退避 | ### 🔧 自动修复 | 功能 | 描述 | |----------------|-------------| | **自动发现 URL** | 如果某个 URL 失败,会自动搜索正确的 URL | | **URL 缓存** | 保存找到的 URL 以备将来运行使用 | | **智能分页** | 自动检测分页模式 | | **回退路径** | 50+ 个可供尝试的替代路径 | ### 🖥️ 界面 | 功能 | 描述 | |----------------|-------------| | **终端** | 包含 12 个命令的菜单,支持颜色和进度条 | | **Web 仪表板** | 4 个交互式图表 (Chart.js) | | **双语** | 完全支持西班牙语和英语 | | **响应式** | 适用于手机、平板电脑和桌面设备 | ### 📊 数据 | 功能 | 数值 | |----------------|-------| | **来源** | 85+ 家报纸 | | **郡** | 32 个(全爱尔兰) | | **犯罪类型** | 9 个类别 | | **关键词** | 100+ 个搜索词 | ### 📥 导出 | 格式 | 用途 | 兼容性 | |---------|-----|----------------| | **JSON** | 完整数据 | 所有应用程序 | | **CSV** | 电子表格 | Excel, Google Sheets, LibreOffice | | **HTML** | 专业报告 | 任何浏览器 | ## 系统要求 ### 最低配置与推荐配置 | 组件 | 最低要求 | 推荐 | |------------|--------|-------------| | **操作系统** | Windows 10 / macOS 11 / Linux | Windows 11 / macOS 14 / Ubuntu 22.04 | | **Python** | 3.8 | 3.11+ | | **RAM** | 512 MB | 1 GB | | **存储空间** | 100 MB | 500 MB | | **互联网** | 1 Mbps | 10 Mbps | ### 检查 Python ``` # Linux / Mac python3 --version # Windows python --version ``` **如果你没有安装 Python:** [下载 Python 3.11+](https://www.python.org/downloads/) ## 分步安装指南 ### 🐧 Linux / 🍎 Mac ``` # 步骤 1:克隆仓库 git clone https://github.com/Condor2026/keltic_kraken cd keltic_kraken # 步骤 2:创建虚拟环境 python3 -m venv venv source venv/bin/activate # 步骤 3:安装依赖 pip install --upgrade pip pip install -r requirements.txt # 步骤 4:验证安装 python3 -c "import requests, bs4, flask; print('✅ Todo correcto')" # 步骤 5:运行 python3 keltic_kraken.py ``` ### 🪟 Windows ``` # 步骤 1:克隆仓库 git clone https://github.com/Condor2026/keltic_kraken cd keltic_kraken # 步骤 2:创建虚拟环境 python -m venv venv venv\Scripts\activate # 步骤 3:安装依赖 pip install --upgrade pip pip install -r requirements.txt # 步骤 4:验证安装 python -c "import requests, bs4, flask; print('✅ Todo correcto')" # 步骤 5:运行 python keltic_kraken.py ``` ### 🐳 Docker ``` # 构建镜像 docker build -t keltic_kraken . # 运行容器 docker run -p 5014:5014 keltic_kraken # 或者使用 docker-compose docker-compose up -d ``` ## 首次使用 - 快速指南 当你**首次**运行时,请按照以下步骤操作: ### 1️⃣ 选择语言 ``` 🌍 SELECCIONE IDIOMA / SELECT LANGUAGE ┌──────────────────────────────────────────────────┐ │ [1] Español │ │ [2] English │ └──────────────────────────────────────────────────┘ ➤ Opción: 1 ``` ### 2️⃣ 选择运行模式 ``` ┌────────────────────────────────────────────────────┐ │ ¿Cómo deseas ejecutar? │ ├────────────────────────────────────────────────────┤ │ [1] Modo Terminal (recomendado para análisis) │ │ [2] Modo Web (dashboard con gráficos) │ └────────────────────────────────────────────────────┘ ➤ Elige: 1 ``` ### 3️⃣ 检查来源(必需) ``` ➤ Opción: 8 ``` **执行的操作:** - ✅ 逐一检查 85+ 个来源 - ✅ 将有效的标记为活跃 - ❌ 将失败的标记为不活跃 - 🔍 对失效的 URL 应用自动发现 - 💾 将找到的 URL 保存到缓存中 **预期结果:** ``` 📊 RESULTADOS: Fuentes activas: 68 de 85 Auto-discovery aplicado: 12 URLs encontradas Caché guardada para futuras ejecuciones ``` ### 4️⃣ 搜索犯罪记录 ``` ➤ Opción: 1 ``` **执行的操作:** - 扫描所有活跃的来源 - 搜索与犯罪相关的关键词 - 提取标题、日期和位置 - 按犯罪类型分类 - 保存到本地数据库 **你将看到:** ``` 🔪 KELTIC KRAKEN - ESCANEANDO IRLANDA ================================================================================ 📰 Irish Times (1/68) 📍 Condado: Dublin 📄 Página 1... ✓ 24 encontrados 📄 Página 2... ✓ 18 encontrados 📄 Página 3... ✓ 12 encontrados 📊 Total en esta fuente: 54 incidentes ``` ### 5️⃣ 查看结果 ``` ➤ Opción: 6 ``` ``` 📰 ÚLTIMOS 20 INCIDENTES ================================================================================ 1. Man arrested after €500k cocaine seizure in Dublin 📅 2026-06-12 | 📍 Dublin | 📰 Irish Times | 🔪 DRUGS 2. Two charged over Kinahan-linked shooting in Cork 📅 2026-06-11 | 📍 Cork | 📰 Irish Examiner | 🔪 GANG_VIOLENCE 3. Gardaí launch operation after body found in Galway 📅 2026-06-11 | 📍 Galway | 📰 RTÉ | 🔪 MURDER ``` ### 6️⃣ (可选)Web 仪表板 ``` ➤ Opción: 5 ``` 打开浏览器访问:**http://localhost:5014** ## 终端菜单命令 | 选项 | 命令 | 执行操作 | 使用时机 | |--------|---------|----------|--------| | **1** | 🔍 搜索犯罪记录 | 扫描所有活跃的来源 | 每天 | | **2** | 📊 完整分析 | 显示详细统计数据 | 搜索后 | | **3** | 🔗 模式分析 | 检测犯罪高发区 | 每周 | | **4** | 📈 趋势演变 | 时间趋势图 | 每月 | | **5** | 🌐 Web 服务器 | 在 localhost 上启动仪表板 | 按需 | | **6** | 📰 最近 20 条 | 列出近期事件 | 快速查看 | | **7** | 📥 导出 | 保存为 JSON/CSV/HTML | 用于分享 | | **8** | 🔍 检查来源 | 更新来源状态 | 每周 | | **9** | 📊 分布情况 | 各类型百分比 | 搜索后 | | **10** | 📈 高级分析 | 密度、趋势等指标 | 深度分析 | | **11** | 🧹 清理 | 删除重复项 | 发现重复数据时 | | **12** | 🗑️ 退出 | 关闭应用程序 | 完成时 | ### 📋 每日流程示例 ``` # 周一上午 9:00 ➤ 8 # Verificar fuentes ➤ 1 # Buscar crímenes nuevos ➤ 6 # Ver últimos incidentes ➤ 2 # Ver estadísticas ➤ 5 # (opcional) Abrir dashboard web ``` ## Web 仪表板 当你运行**选项 5** 时,会在 `http://localhost:5014` 启动一个 Web 服务器 ### 📊 图表 1:各郡事件统计(柱状图) | 元素 | 描述 | |----------|-------------| | **类型** | 垂直柱状图 | | **数据** | 每个郡的事件数量 | | **交互** | 鼠标悬停可查看确切数字 | | **用途** | 识别热点区域 | **揭示内容:** - 都柏林通常位居榜首(人口越多 = 犯罪越多) - 科克位居第二 - 犯罪活动的地理分布模式 ### 🥧 图表 2:犯罪类型(环形图) | 类型 | 颜色 | 描述 | |------|-------|-------------| | 💊 毒品 | 深红色 | 毒品交易、查扣、走私 | | 🔫 帮派暴力 | 红色 | 帮派暴力 (Kinahan, Hutch) | | 💀 谋杀 | 黑色 | 谋杀和过失杀人 | | 👮 警察行动 | 蓝色 | 警方行动 | | 👊 人身攻击 | 橙色 | 袭击 | | 💰 抢劫 | 黄色 | 抢劫和盗窃 | | 🕴️ 有组织犯罪 | 紫色 | 有组织犯罪 | | 🔪 武器 | 石榴红 | 涉及武器的犯罪 | | ❓ 其他 | 灰色 | 其他类型 | ### 📈 图表 3:月度趋势(折线图) | 元素 | 描述 | |----------|-------------| | **类型** | 带填充的折线图 | | **数据** | 逐月演变趋势 | | **趋势** | 视觉上的上升/下降 | | **用途** | 检测季节性规律 | **解答的问题:** - 犯罪率是在上升还是下降? - 在特定月份是否有高峰? - 今年与去年相比如何? ### 📊 图表 4:热门来源(水平条形图) | 元素 | 描述 | |----------|-------------| | **类型** | 水平条形图 | | **数据** | 最活跃的报纸 | | **排序** | 从高到低 | | **用途** | 识别提供最多信息的来源 | ### 📋 事件列表 每张卡片显示: - 新闻的**完整标题** - 发布**日期** - 发生所在的**郡** - **来源**(报纸) - 带有颜色标识的犯罪**类型** ### 🎛️ Web 控制选项 | 按钮 | 功能 | |-------|---------| | 🔄 更新数据 | 扫描来源并更新 | | 📥 JSON | 下载 JSON 格式的数据 | | 📥 CSV | 下载 CSV 格式 | | 📄 HTML 报告 | 生成专业报告 | | 全部 | 所有事件 | | 7天 | 最近 7 天 | | 30天 | 最近 30 天 | | 90天 | 最近 90 天 | ## 覆盖范围 ### 爱尔兰共和国(26 个郡) | 郡 | 来源 | 主要媒体 | |---------|---------|-------------------| | **Dublin** | 7 | Irish Times, Irish Independent, RTÉ, Dublin Live | | **Cork** | 5 | Irish Examiner, Cork Beo, Cork Independent | | **Galway** | 4 | Galway Beo, Galway Advertiser, Connacht Tribune | | **Limerick** | 4 | Limerick Leader, Limerick Post | | **Kerry** | 4 | Kerryman, Radio Kerry | | **Donegal** | 4 | Donegal Daily, Donegal News | | **Mayo** | 4 | Mayo News, Connaught Telegraph | | **Wexford** | 4 | Wexford People, Wexford Echo | | **Kildare** | 4 | Kildare Now, KFM Radio | | **Tipperary** | 4 | Tipperary Live, Tipp FM | | **Louth** | 4 | Louth Live, LMFM | | **Waterford** | 3 | Waterford News, Waterford Live | | **Clare** | 4 | Clare Champion, Clare FM | | **Sligo** | 3 | Sligo Champion, Ocean FM | | **其他** | 2-3 | 当地媒体 | ### 北爱尔兰(6 个郡) | 郡 | 来源 | 主要媒体 | |---------|---------|-------------------| | **Antrim (Belfast)** | 5 | Belfast Telegraph, Irish News, Belfast Live | | **Derry/Londonderry** | 3 | Derry Journal, Derry Now | | **Down** | 2 Down Recorder, Newry Reporter | | **Tyrone** | 2 | Tyrone Times, Ulster Herald | | **Armagh** | 2 | Armagh I, Lurgan Mail | | **Fermanagh** | 2 | Fermanagh Herald, Impartial Reporter | ### 📊 总计 | 区域 | 郡 | 来源 | |--------|----------|---------| | 爱尔兰共和国 | 26 | ~65 | | 北爱尔兰 | 6 | ~20 | | **总计** | **32** | **85+** | ## 项目结构 ``` keltic-kraken/ │ ├── 📄 keltic_kraken.py # Script principal (2250+ líneas) ├── 📄 requirements.txt # Dependencias Python ├── 📄 README.md # Este documento ├── 📄 LICENSE # GPL v3 │ ├── 📊 keltic_kraken_ireland.json # Base de datos de incidentes ├── 💾 keltic_kraken_backup.json # Copia de seguridad automática ├── 🗺️ url_cache_ireland.json # Caché de URLs descubiertas ├── 📡 estado_fuentes_ireland.json # Estado de cada fuente │ ├── 📤 keltic_kraken_export.json # Exportación manual (JSON) ├── 📤 keltic_kraken_export.csv # Exportación manual (CSV) ├── 📤 keltic_kraken_report.html # Exportación manual (HTML) │ └── 📁 docs/ # Documentación extra ├── usage.md ├── api.md └── screenshots/ ``` ### 自动生成的文件 | 文件 | 生成时机 | 包含内容 | |---------|--------|--------------| | `keltic_kraken_ireland.json` | 首次运行 | 所有事件记录 | | `url_cache_ireland.json` | 自动发现时 | 替代的 URL | | `estado_fuentes_ireland.json` | 选项 8 | 活跃/不活跃状态 | | `keltic_kraken_backup.json` | 每次保存时 | 数据备份 | ### ❓ 这合法吗? **是的。** 该系统: - 仅访问**公开**数据 - 遵守请求之间的延迟 - 不会使服务器过载 - 不破坏安全措施 - 仅使用报纸的公开板块 ### ❓ 我可以将其用于其他国家吗? 该系统专为爱尔兰设计,但可以通过以下方式进行改编: 1. 修改 `FUENTES_BASE`(报纸列表) 2. 修改 `PALABRAS_CLAVE_CRIMEN`(本地搜索词汇) 3. 修改 `CONDADOS_IRLANDA`(替换为该国的地区) 4. 修改 `TIPOS_CRIMEN`(本地犯罪类别) ### ❓ 数据保存在哪里? 保存在 `keltic_kraken_ireland.json`(可读的 JSON 格式)中 ### ❓ 我可以导出数据吗? **是的,支持三种格式:** - `➤ 7` → 导出为 JSON、CSV 和 HTML - Web 端的 📥 JSON 按钮 - Web 端的 📥 CSV 按钮 - Web 端的 📄 HTML 报告 按钮 ### ❓ 会消耗大量资源吗? **不会。** 典型使用情况: - RAM:~200-500 MB - CPU:抓取期间约占 10-20% - 存储:每月约 10-50 MB 数据 ### ❓ 支持移动端吗? **支持。** Web 仪表板具有响应式设计,适用于: - iPhone (iOS) - Android - 平板电脑 - iPad ## 许可证 **GNU General Public License v3.0** ``` Copyright (C) 2026 Condor2026 / SpectrumSecurity This program is free software: you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation, either version 3 of the License, or (at your option) any later version. This program is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License for more details. You should have received a copy of the GNU General Public License along with this program. If not, see
🔪 "能力越大,责任越大" - 蜘蛛侠
基于数据的情报,旨在提升公共安全意识
P.S. 如果你是一个正在读这段话的毒贩……警察已经在路上了。☘️
标签:Flask, Python, Splunk, 代码示例, 子域名突变, 情报平台, 数据分析, 无后门, 舆情监控, 请求拦截, 逆向工具