Sarvesh-Jhawar/CyberRakshak
GitHub: Sarvesh-Jhawar/CyberRakshak
CyberRakshak是一款结合了LLM和机器学习的AI网络安全平台,用于智能威胁检测和事件响应。
Stars: 0 | Forks: 0
# 🛡️ CyberRakshak:AI 驱动的网络安全助手
**由大型语言模型(LLM)和专用机器学习驱动的智能、多层次威胁检测和缓解聊天机器人系统。**
[](https://github.com/Sarvesh-Jhawar/CyberRakshak.git)
## 📖 项目概述
**CyberRakshak** 是一款高级网络安全聊天机器人,旨在弥合复杂机器学习威胁检测与用户友好的事件响应之间的差距。
用户无需手动解析恶意文件、URL 或网络日志,只需**描述他们的问题或粘贴可疑数据到聊天中**。CyberRakshak 的智能架构会动态路由问题,同步使用生成式 AI 和专用机器学习数组进行分析,并综合生成一份全面的事件报告。
## 🚀 如何运行项目(简单步骤)
1. **安装必备条件**:安装 [Python](https://www.python.org/downloads/)、[Node.js](https://nodejs.org/)和 [PostgreSQL](https://www.postgresql.org/download/)。
2. **设置数据库**:在本地 PostgreSQL 中创建一个名为 `cyberrakshak` 的数据库(使用 pgAdmin)。
3. **配置环境**:
- 将 `Backend/env.example` 复制到 `Backend/.env`。
- 使用您的本地 PostgreSQL 凭据更新 `DATABASE_URL` 并添加您的 `GROQ_API_KEY`。
4. **启动**:在主文件夹中双击 **`executable_file.bat`**。
*注意:第一次运行将自动安装所有依赖项,因此可能需要几分钟时间。*
## 📁 交互式项目导航器
通过点击下面的文件夹探索项目结构和技术文档:
* **[📂 后端](./Backend/)**:核心 FastAPI 逻辑、PostgreSQL 集成和安全协议。
* **[📂 前端](./Frontend/)**:Next.js 14 仪表板、聊天 UI 和专用组件。
* **[📂 机器学习](./models/)**:智能层的核心(5 个专用威胁模型)。
* **[📂 LLM 层](./llm/)**:AI 调度、意图路由和合成逻辑。
### 📑 技术文档
* **[📝 技术历程](./DEVELOPMENT_JOURNEY.md)**:关于如何构建此项目的详细、分步说明。
## ⚙️ 工作原理(核心架构)
CyberRakshak 在高速、双引擎的“路由器到合成器”架构上运行:
```
graph TD
%% Styling Definitions
classDef user fill:#2d3748,stroke:#4a5568,stroke-width:2px,color:#fff
classDef router fill:#805ad5,stroke:#e9d8fd,stroke-width:2px,color:#fff
classDef ml fill:#2b6cb0,stroke:#63b3ed,stroke-width:2px,color:#fff
classDef synth fill:#4c51bf,stroke:#c3dafe,stroke-width:2px,color:#fff
classDef output fill:#276749,stroke:#9ae6b4,stroke-width:2px,color:#fff
subgraph UserInterface["🌐 Frontend Layer"]
User["👤 User (Victim/Analyst)"]
Chatbot["💬 Chatbot Interface"]
Input["📝 Input (Logs, URL, Issue Desc.)"]
end
subgraph BackendAPI["⚙️ Backend Logic & Routing"]
API["🔌 Backend Controller (FastAPI/Node)"]
LLM_Router["🧠 Initial LLM Router(Categorizes Intent)"] end subgraph MLSubsystem["🛡️ Specialized ML Subsystem"] M1["🌐 Networking Model
(RF + Precision Pruning)"] M2["🗄️ Ransomware Model
(SelectKBest ANOVA + RF)"] M3["🎣 Phishing Engine
(Feature Extraction + RF)"] M4["🦠 Malware Analyser
(PE Structure RF)"] M5["🕵️ Zero-Day Predictor
(Logistic Regression)"] end subgraph AnalysisLayer["🔬 Dual-Engine Analysis Phase"] LLM_Context["🧠 LLM Contextual Analysis
(Heuristics & Threat Intel)"] ML_Score["📊 Hard Mathematical Score
& Confidence Array"] end subgraph FinalReporting["📤 Final Synthesis Layer"] Synthesizer["⚡ Dual-Engine Synthesizer
(LLM Generates Final Report)"] Verdict["🔎 Final Threat Verdict & ML Stats"] Mitigation["🛠️ Quarantine/Preventative Steps"] Reporting["📞 Official Complaint Protocol"] end %% Wiring User Input User --> Chatbot Chatbot --> Input Input --> API API --> LLM_Router %% Routing to Specialized ML Models LLM_Router -- "Detects Network Traffic" --> M1 LLM_Router -- "Detects OS/Registry Anomaly" --> M2 LLM_Router -- "Detects Suspicious URL" --> M3 LLM_Router -- "Detects Suspicious File/PE" --> M4 LLM_Router -- "Detects Unknown Payload" --> M5 %% Simultaneous LLM Path LLM_Router -- "Parallel Processing" --> LLM_Context %% Aggregating ML Scores M1 --> ML_Score M2 --> ML_Score M3 --> ML_Score M4 --> ML_Score M5 --> ML_Score %% Synthesis & Report Generation ML_Score --> Synthesizer LLM_Context --> Synthesizer Synthesizer --> Verdict Synthesizer --> Mitigation Synthesizer --> Reporting %% Loop back to user Verdict -.-> Chatbot Mitigation -.-> Chatbot Reporting -.-> Chatbot %% Assigning Colors class User,Chatbot,Input user class API,LLM_Router router class M1,M2,M3,M4,M5,ML_Score ml class LLM_Context,Synthesizer synth class Verdict,Mitigation,Reporting output ``` 1. **📥 用户输入(提示):** 用户将可疑日志、URL、恶意哈希或描述网络事件粘贴到聊天机器人中。 2. **🔀 LLM 路由引擎:** 核心大型语言模型拦截提示并动态分类威胁向量(例如,*这是钓鱼攻击吗?网络入侵?勒索软件?*)。 3. **⚡ 双执行阶段:** - **机器学习分析:** LLM 主动触发针对已识别威胁的特定、预训练的本地 ML 模型,以实现硬数学概率评分。 - **LLM 上下文分析:** 同时,LLM 分析原始文本/代码的启发式上下文,利用其庞大的网络安全训练数据。 4. **🧠 LLM 合成:** 将硬数学 ML 预测和 LLM 的上下文发现都反馈到中央 LLM 引擎。 5. **📤 最终输出生成:** 聊天机器人回复一个格式整洁、高度可操作的分析报告。 ## 🧠 机器学习武器库 在幕后,LLM 将数据路由到五个深度优化、正则化约束的机器学习管道之一: - 🌐 **网络异常模型:** 随机森林过滤 TCP/UDP 侵入模式。 - 🦠 **恶意软件检测模型:** 树集成解析可移植可执行(PE)架构和内存状态。 - 🗄️ **勒索软件行为模型:** ANOVA 优化的特征选择针对快速 OS 注册表/API 损坏。 - 🎣 **钓鱼评估器:** 从可疑 URL 中提取结构启发式。 - 🕵️ **零日预测器:** 逻辑回归将通用、未记录的有效载荷异常映射到拦截先前未见的威胁。 *(注意:请参阅 `models/` 目录中每个管道的专用、深度技术 README,解释了每个管道的训练、数据集映射和超参数调整。)* ## 🎯 最终智能报告 当 CyberRakshak 成功合成事件时,用户将收到一份可操作的**威胁缓解报告**,保证: * **📊 数学置信度:** 触发的 ML 模型的精确输出精度和准确度评分。 * **🔎 威胁判决:** 清晰的“恶意”或“良性”决定。 * **🛠️ 上下文分解:** 系统为什么认为它是恶意的(由 LLM 驱动)。 * **🛡️ 预防措施:** 立即、定制的行动项目,以隔离威胁或保护网络。 * **📞 报告协议:** 根据向量提供如何和在哪里提交官方网络投诉或事件报告的指导。
"通过混合人工智能增强持续防御。”