Sarvesh-Jhawar/CyberRakshak

GitHub: Sarvesh-Jhawar/CyberRakshak

CyberRakshak是一款结合了LLM和机器学习的AI网络安全平台，用于智能威胁检测和事件响应。

Stars: 0 | Forks: 0

# 🛡️ CyberRakshak：AI 驱动的网络安全助手 **由大型语言模型（LLM）和专用机器学习驱动的智能、多层次威胁检测和缓解聊天机器人系统。** [![GitHub 仓库](https://img.shields.io/badge/GitHub-Repository-blue?logo=github)](https://github.com/Sarvesh-Jhawar/CyberRakshak.git)

## 📖 项目概述 **CyberRakshak** 是一款高级网络安全聊天机器人，旨在弥合复杂机器学习威胁检测与用户友好的事件响应之间的差距。用户无需手动解析恶意文件、URL 或网络日志，只需**描述他们的问题或粘贴可疑数据到聊天中**。CyberRakshak 的智能架构会动态路由问题，同步使用生成式 AI 和专用机器学习数组进行分析，并综合生成一份全面的事件报告。 ## 🚀 如何运行项目（简单步骤） 1. **安装必备条件**：安装 [Python](https://www.python.org/downloads/)、[Node.js](https://nodejs.org/）和 [PostgreSQL](https://www.postgresql.org/download/）。 2. **设置数据库**：在本地 PostgreSQL 中创建一个名为 `cyberrakshak` 的数据库（使用 pgAdmin）。 3. **配置环境**： - 将 `Backend/env.example` 复制到 `Backend/.env`。 - 使用您的本地 PostgreSQL 凭据更新 `DATABASE_URL` 并添加您的 `GROQ_API_KEY`。 4. **启动**：在主文件夹中双击 **`executable_file.bat`**。 *注意：第一次运行将自动安装所有依赖项，因此可能需要几分钟时间。* ## 📁 交互式项目导航器通过点击下面的文件夹探索项目结构和技术文档： * **[📂 后端](./Backend/)**：核心 FastAPI 逻辑、PostgreSQL 集成和安全协议。 * **[📂 前端](./Frontend/)**：Next.js 14 仪表板、聊天 UI 和专用组件。 * **[📂 机器学习](./models/)**：智能层的核心（5 个专用威胁模型）。 * **[📂 LLM 层](./llm/)**：AI 调度、意图路由和合成逻辑。 ### 📑 技术文档 * **[📝 技术历程](./DEVELOPMENT_JOURNEY.md)**：关于如何构建此项目的详细、分步说明。 ## ⚙️ 工作原理（核心架构） CyberRakshak 在高速、双引擎的“路由器到合成器”架构上运行： ``` graph TD %% Styling Definitions classDef user fill:#2d3748,stroke:#4a5568,stroke-width:2px,color:#fff classDef router fill:#805ad5,stroke:#e9d8fd,stroke-width:2px,color:#fff classDef ml fill:#2b6cb0,stroke:#63b3ed,stroke-width:2px,color:#fff classDef synth fill:#4c51bf,stroke:#c3dafe,stroke-width:2px,color:#fff classDef output fill:#276749,stroke:#9ae6b4,stroke-width:2px,color:#fff subgraph UserInterface["🌐 Frontend Layer"] User["👤 User (Victim/Analyst)"] Chatbot["💬 Chatbot Interface"] Input["📝 Input (Logs, URL, Issue Desc.)"] end subgraph BackendAPI["⚙️ Backend Logic & Routing"] API["🔌 Backend Controller (FastAPI/Node)"] LLM_Router["🧠 Initial LLM Router
(Categorizes Intent)"] end subgraph MLSubsystem["🛡️ Specialized ML Subsystem"] M1["🌐 Networking Model
(RF + Precision Pruning)"] M2["🗄️ Ransomware Model
(SelectKBest ANOVA + RF)"] M3["🎣 Phishing Engine
(Feature Extraction + RF)"] M4["🦠 Malware Analyser
(PE Structure RF)"] M5["🕵️ Zero-Day Predictor
(Logistic Regression)"] end subgraph AnalysisLayer["🔬 Dual-Engine Analysis Phase"] LLM_Context["🧠 LLM Contextual Analysis
(Heuristics & Threat Intel)"] ML_Score["📊 Hard Mathematical Score
& Confidence Array"] end subgraph FinalReporting["📤 Final Synthesis Layer"] Synthesizer["⚡ Dual-Engine Synthesizer
(LLM Generates Final Report)"] Verdict["🔎 Final Threat Verdict & ML Stats"] Mitigation["🛠️ Quarantine/Preventative Steps"] Reporting["📞 Official Complaint Protocol"] end %% Wiring User Input User --> Chatbot Chatbot --> Input Input --> API API --> LLM_Router %% Routing to Specialized ML Models LLM_Router -- "Detects Network Traffic" --> M1 LLM_Router -- "Detects OS/Registry Anomaly" --> M2 LLM_Router -- "Detects Suspicious URL" --> M3 LLM_Router -- "Detects Suspicious File/PE" --> M4 LLM_Router -- "Detects Unknown Payload" --> M5 %% Simultaneous LLM Path LLM_Router -- "Parallel Processing" --> LLM_Context %% Aggregating ML Scores M1 --> ML_Score M2 --> ML_Score M3 --> ML_Score M4 --> ML_Score M5 --> ML_Score %% Synthesis & Report Generation ML_Score --> Synthesizer LLM_Context --> Synthesizer Synthesizer --> Verdict Synthesizer --> Mitigation Synthesizer --> Reporting %% Loop back to user Verdict -.-> Chatbot Mitigation -.-> Chatbot Reporting -.-> Chatbot %% Assigning Colors class User,Chatbot,Input user class API,LLM_Router router class M1,M2,M3,M4,M5,ML_Score ml class LLM_Context,Synthesizer synth class Verdict,Mitigation,Reporting output ``` 1. **📥 用户输入（提示）：** 用户将可疑日志、URL、恶意哈希或描述网络事件粘贴到聊天机器人中。 2. **🔀 LLM 路由引擎：** 核心大型语言模型拦截提示并动态分类威胁向量（例如，*这是钓鱼攻击吗？网络入侵？勒索软件？*）。 3. **⚡ 双执行阶段：** - **机器学习分析：** LLM 主动触发针对已识别威胁的特定、预训练的本地 ML 模型，以实现硬数学概率评分。 - **LLM 上下文分析：** 同时，LLM 分析原始文本/代码的启发式上下文，利用其庞大的网络安全训练数据。 4. **🧠 LLM 合成：** 将硬数学 ML 预测和 LLM 的上下文发现都反馈到中央 LLM 引擎。 5. **📤 最终输出生成：** 聊天机器人回复一个格式整洁、高度可操作的分析报告。 ## 🧠 机器学习武器库在幕后，LLM 将数据路由到五个深度优化、正则化约束的机器学习管道之一： - 🌐 **网络异常模型：** 随机森林过滤 TCP/UDP 侵入模式。 - 🦠 **恶意软件检测模型：** 树集成解析可移植可执行（PE）架构和内存状态。 - 🗄️ **勒索软件行为模型：** ANOVA 优化的特征选择针对快速 OS 注册表/API 损坏。 - 🎣 **钓鱼评估器：** 从可疑 URL 中提取结构启发式。 - 🕵️ **零日预测器：** 逻辑回归将通用、未记录的有效载荷异常映射到拦截先前未见的威胁。 *(注意：请参阅 `models/` 目录中每个管道的专用、深度技术 README，解释了每个管道的训练、数据集映射和超参数调整。)* ## 🎯 最终智能报告当 CyberRakshak 成功合成事件时，用户将收到一份可操作的**威胁缓解报告**，保证： * **📊 数学置信度：** 触发的 ML 模型的精确输出精度和准确度评分。 * **🔎 威胁判决：** 清晰的“恶意”或“良性”决定。 * **🛠️ 上下文分解：** 系统为什么认为它是恶意的（由 LLM 驱动）。 * **🛡️ 预防措施：** 立即、定制的行动项目，以隔离威胁或保护网络。 * **📞 报告协议：** 根据向量提供如何和在哪里提交官方网络投诉或事件报告的指导。

"通过混合人工智能增强持续防御。”