engrarslan99/Email-Sentinel-AI-Powered-Phishing-Detection-Browser-Extension-

GitHub: engrarslan99/Email-Sentinel-AI-Powered-Phishing-Detection-Browser-Extension-

一个AI驱动的浏览器扩展，用于实时检测Gmail和Outlook中的钓鱼邮件，通过多层检测提供信任评分和风险等级。

Stars: 0 | Forks: 0

# 🛡️ MailSentinel — 用于电子邮件安全的浏览器扩展 ## 📖 概述 MailSentinel 是一款浏览器扩展，用于分析 Gmail 和 Outlook 网页版上的电子邮件，以确定它们是安全的还是潜在的网络钓鱼尝试。它不仅仅提供简单的垃圾邮件标签，而是生成一个**信任评分（0–100）**，该评分基于三个互补的检测层，为用户提供在交互时刻透明、可操作的洞察。 ## ✨ 功能特点 - **多层检测**：结合 NLP 分类、基于规则的启发式方法和实时 URL 威胁情报 - **信任评分框架**：使用加权评分，而非简单的安全/不安全二元判定 - **颜色编码的风险等级**：为每封分析的邮件提供即时的视觉反馈 - **URL 安全分析**：扫描并高亮显示每封邮件中的嵌入链接（安全 = 绿色，可疑 = 红色，被 Google SB 标记 = `SB` 徽章） - **情境化解释**：告知您邮件被标记的*原因*（例如，语法错误、紧急语言、可疑域名） - **支持 Gmail 和 Outlook**：兼容两大主流网络邮件平台 ## 🎯 信任评分等级 | 评分 | 等级 | 颜色 | |------|------|------| | 85–100 | 安全 | 🟢 绿色 | | 70–84 | 可能安全 | 🟩 浅绿色 | | 55–69 | 可疑 | 🟡 黄色 | | 40–54 | 有风险 | 🟠 橙色 | | 20–39 | 高风险 | 🔴 红色 | | 0–19 | 危险 | 🟥 深红色 | ## 🏗️ 架构该系统采用三层架构： ``` Browser Extension (Manifest V3) └── content.js — Extracts sender, subject, body, URLs from Gmail/Outlook DOM └── popup.js — Displays Trust Score, URL analysis, and threat explanations │ ▼ JSON (sender, subject, body, URLs) FastAPI Backend (Python) ├── Rule-Based Analyzer (weight: 20%) ├── NLP Classifier (weight: 50%) └── Google Safe Browsing (weight: 30%) │ ▼ Trust Score + Threat Breakdown Popup UI — Color-coded results rendered in the browser ``` ### 信任评分公式 ``` Combined Risk = (ML Score × 0.50) + (API Score × 0.30) + (Rules Score × 0.20) Final Score = 100 − Combined Risk ``` ## 🧠 检测层 ### 1. NLP 分类器（50%） - 基于**42,000+ 封已标记邮件**（SpamAssassin + CEAS_08 数据集）训练 - 使用 TF-IDF 向量化 + 监督分类器 - 输出垃圾邮件概率，并转换为 0–100 的风险评分 ### 2. Google Safe Browsing API（30%） - 所有嵌入的 URL 均会对照 Google 的实时威胁数据库进行检查 - 实时检测恶意域名，包括零日钓鱼 URL - API 评分 = `(恶意 URL 数 ÷ 总 URL 数) × 100` ### 3. 基于规则的分析（20%） - 轻量级 Python 启发式评估： | 组件 | 触发条件 | 权重 | |------|----------|------| | 主题 | 紧急关键词、全大写、过多标点符号 | 20% | | 发件人 | 域名欺骗、可疑 TLD、数字域名 | 30% | | 正文 | 凭据请求、语法错误、通用问候语 | 35% | | URL | 短链接服务、混淆链接、域名不匹配 | 15% | ## 🛠️ 技术栈 | 层级 | 技术 | |------|------| | 浏览器扩展 | JavaScript (ES6), Manifest V3 | | 后端 | Python 3.10, FastAPI 0.95.0 | | 机器学习 | Scikit-learn, TF-IDF 向量化器 | | 外部 API | Google Safe Browsing API v4 | | 前端 | HTML, CSS, JavaScript | ## 🚀 快速入门 ### 前置条件 - Python 3.10+ - Google Chrome - 一个 [Google Safe Browsing API 密钥](https://developers.google.com/safe-browsing/) ### 1. 克隆仓库 ``` git clone https://github.com/engrarslan99/email-sentinel.git cd mailsentinel ``` ### 2. 设置后端 ``` cd backend pip install -r requirements.txt ``` 将你的 Google Safe Browsing API 密钥添加到环境变量中： ``` export SAFE_BROWSING_API_KEY=your_api_key_here ``` 启动 FastAPI 服务器： ``` uvicorn main:app --reload ``` 后端将运行在 `http://127.0.0.1:8000`。你可以在 `/health` 路径验证其是否正常工作。 ### 3. 加载 Chrome 扩展 1. 打开 Chrome 并导航至 `chrome://extensions/` 2. 启用**开发者模式**（右上角开关） 3. 点击**加载已解压的扩展程序**，然后选择 `extension/` 文件夹 4. MailSentinel 图标将出现在你的工具栏中 ### 4. 使用 1. 在 Chrome 中打开 Gmail 或 Outlook 2. 点击任意一封邮件 3. 点击 MailSentinel 扩展图标 4. 查看信任评分、风险等级和 URL 分析结果 ## 🧪 测试结果 | 组件 | 准确率 | |------|--------| | 机器学习分类器 | 在测试数据集上 85% | | Google Safe Browsing | 对已知恶意 URL 100% | | 基于规则的分析 | 对可疑模式 92% 有效性 | | 标准 URL 检测 | 98% 准确率 | ## ⚠️ 局限性 - 扩展程序需要本地运行（或部署）的后端才能工作 - 由于动态渲染，Outlook 的 DOM 提取比 Gmail 更复杂 - Google Safe Browsing API 有速率限制，可能会影响大规模使用 - NLP 模型偶尔会将合法的营销邮件误判为可疑邮件 - 主要在 Google Chrome 上测试；Firefox 和 Edge 支持可能需要额外测试 - 由于文件大小，此仓库中未包含 `data/` 文件夹（训练数据集）。请从下方参考部分的链接下载数据集 ## 🔮 未来工作 - 支持 Firefox、Edge 和 Safari - 基于 BERT / Transformer 的 NLP 模型以获得更高的检测准确率 - 云端部署后端以消除本地依赖 - 主动式网络安全教育通知 - Microsoft Graph API 集成作为可选的 Outlook 备用方案 ## 📚 参考资料本项目使用的关键数据集和 API： - [SpamAssassin 公开语料库](https://spamassassin.apache.org/old/publiccorpus/) - [CEAS 2008 垃圾邮件数据集](http://www.ceas.cc/2008/) - [Google Safe Browsing API](https://developers.google.com/safe-browsing/) - Verizon 2023 年数据泄露调查报告 ## 👤 作者 **Muhammad Arslan Ashfaq** 计算学硕士 — 都柏林格里菲斯学院指导老师：Ahmed Olalekan 2025年9月 ## 📄 许可证本项目作为学术论文开发。在重复使用或重新分发本作品的任何部分之前，请联系作者。

标签：AI安全检测, Apex, API, AV绕过, Edge扩展, FastAPI, Firefox扩展, Gmail支持, Manifest V3, Outlook支持, Python, URL安全分析, 上下文解释, 信任评分, 反钓鱼, 多层检测, 多模态安全, 实时检测, 无后门, 机器学习, 浏览器扩展, 电子邮件安全, 网络安全, 自定义脚本, 规则启发式, 谷歌安全浏览, 邮件安全工具, 钓鱼邮件检测, 钓鱼防护, 隐私保护, 颜色编码, 风险等级