nitin-manral/AI_BASED_FAKE_OFFER_DETECTION_SYSTEM

GitHub: nitin-manral/AI_BASED_FAKE_OFFER_DETECTION_SYSTEM

基于Flask的虚假招聘检测系统，融合机器学习分类、规则引擎和威胁情报技术，帮助求职者识别欺诈性招聘信息并生成风险评估报告。

Stars: 1 | Forks: 0

# 基于AI的虚假招聘检测系统本项目利用机器学习和威胁情报技术检测虚假招聘信息和诈骗公司。它有助于用户识别欺诈性招聘邀约，避免网络诈骗。 ## MCA 水平项目一款专业的 Flask Web 应用程序，结合 AI 和基于规则的检测来识别虚假招聘信息，保护求职者免受诈骗。 ## 功能特性 ### 1. 智能职位分析器 - 多输入分析（职位链接、描述、公司名称、HR 邮箱） - 基于规则的检测，支持可疑关键词匹配 - 使用 WHOIS 进行域名年龄验证 - HTTPS/SSL 证书验证 - 邮箱与域名不匹配检测 - 使用 TF-IDF + Logistic Regression 进行 ML 分类 - 风险评分（0-100），分为低/中/高类别 - 危险信号（Red flag）高亮显示 - AI 驱动的建议 ### 2. 虚假公司数据库 - 已知诈骗公司的可搜索数据库 - 诈骗类型分类 - 投诉追踪系统 - 详细的诈骗手法解释 - 用户投诉提交 ### 3. 正规公司名录 - 已验证的公司资料 - 官方网站链接 - 招聘流程信息 - 资格标准 - 申请人安全提示 ### 4. 分析仪表盘 - 总扫描统计 - 风险分布可视化 - 投诉分析 - 最常被搜索的公司 - 使用 Chart.js 的交互式图表 ### 5. 分析历史 - 完整的扫描历史 - 可下载的 PDF 报告 - 历史风险追踪 ### 6. PDF 报告生成器 - 专业的分析报告 - 风险评估详情 - 建议 - 可下载格式 ### 7. 管理面板 - 安全登录系统（用户名：admin，密码：admin123） - 管理虚假公司数据库 - 管理正规公司名录 - 查看和监控投诉 - 系统分析 ## 技术栈 - **后端**: Flask, SQLAlchemy - **数据库**: SQLite - **前端**: HTML5, CSS3, Bootstrap 5, JavaScript - **ML**: scikit-learn (TF-IDF Vectorizer, Logistic Regression) - **其他**: python-whois, reportlab, Chart.js ## 安装 1. 安装依赖项： ``` pip install -r requirements.txt ``` 2. 运行应用程序： ``` python app.py ``` 3. 打开浏览器并访问： ``` http://127.0.0.1:5000 ``` ## 项目结构 ``` fake_job_detector/ ├── app.py # Main Flask application ├── requirements.txt # Python dependencies ├── job_detector.db # SQLite database (auto-created) ├── README.md # Project documentation ├── templates/ # HTML templates │ ├── base.html │ ├── index.html │ ├── analyze.html │ ├── fake_companies.html │ ├── fake_company_detail.html │ ├── genuine_companies.html │ ├── genuine_company_detail.html │ ├── history.html │ ├── analytics.html │ ├── admin_login.html │ ├── admin_dashboard.html │ ├── admin_fake_companies.html │ ├── admin_genuine_companies.html │ └── admin_complaints.html └── static/ ├── css/ │ └── style.css # Dark cybersecurity theme └── js/ └── script.js # Interactive features ``` ## 使用说明 ### 对于用户： 1. 从侧边栏导航至 "Analyze Job"（分析职位） 2. 输入职位详情（描述为必填项） 3. 提交以进行分析 4. 查看风险评分、ML 预测和危险信号 5. 如有需要，下载 PDF 报告 ### 对于管理员： 1. 点击侧边栏中的 "Admin"（管理） 2. 使用凭据登录（admin/admin123） 3. 管理虚假/正规公司 4. 查看投诉和分析数据 ## ML 模型系统使用 Logistic Regression 分类器进行训练，基于： - **虚假职位指标**：紧急招聘、注册费、个人邮箱、不切实际的承诺 - **正规职位指标**：专业要求、官方渠道、流程透明 **特征**：具有 500 个特征的 TF-IDF 向量化 **准确性**：在平衡数据集上训练，用于二分类 ## 风险评分算法 ``` Risk Score = (Red Flags × 5) + Domain Age Score + HTTPS Score + Email Mismatch Score + ML Score - Red Flags: 5 points each - Domain Age < 180 days: 20 points - No HTTPS: 15 points - Email Mismatch: 20 points - ML Prediction "Fake": 30 points Total: 0-100 (Low: <30, Medium: 30-60, High: >60) ``` ## 安全特性 - 基于会话的管理员身份验证 - 通过 SQLAlchemy ORM 防止 SQL 注入 - 输入验证和清理 - 安全的密码处理（注意：在生产环境中应使用哈希处理） ## 未来改进方向 - 邮箱验证系统 - 公司 Logo 验证 - 社交媒体资料分析 - 用户注册和个性化仪表盘 - 与招聘门户网站的 API 集成 - 高级 NLP 模型（BERT, transformers） ## 致谢作为 MCA 水平的项目开发，展示了： - 全栈 Web 开发 - 机器学习集成 - 数据库设计与管理 - 安全最佳实践 - 专业的 UI/UX 设计 ## 许可证用于学术目的的教育项目。

标签：Apex, Bootstrap 5, Chart.js, DAST, ESC8, Flask, HR安全, NLP, PDF报告生成, Python, Scikit-learn, Sigma 规则, SQLAlchemy, SQLite, SSL证书验证, TF-IDF, Web应用开发, WHOIS查询, 云计算, 人工智能, 仪表盘, 协议探测, 反诈骗系统, 域名分析, 威胁情报, 开发者工具, 恶意软件分析, 数据可视化, 数据清洗, 文本分类, 无后门, 机器学习, 欺诈检测, 求职安全, 用户模式Hook绕过, 社会工程学, 社会工程学防御, 网络安全, 网络钓鱼检测, 虚假招聘检测, 规则引擎, 诈骗识别, 逆向工具, 逻辑回归, 隐私保护