nitin-manral/AI_BASED_FAKE_OFFER_DETECTION_SYSTEM

GitHub: nitin-manral/AI_BASED_FAKE_OFFER_DETECTION_SYSTEM

基于Flask的虚假招聘检测系统,融合机器学习分类、规则引擎和威胁情报技术,帮助求职者识别欺诈性招聘信息并生成风险评估报告。

Stars: 1 | Forks: 0

# 基于AI的虚假招聘检测系统 本项目利用机器学习和威胁情报技术检测虚假招聘信息和诈骗公司。 它有助于用户识别欺诈性招聘邀约,避免网络诈骗。 ## MCA 水平项目 一款专业的 Flask Web 应用程序,结合 AI 和基于规则的检测来识别虚假招聘信息,保护求职者免受诈骗。 ## 功能特性 ### 1. 智能职位分析器 - 多输入分析(职位链接、描述、公司名称、HR 邮箱) - 基于规则的检测,支持可疑关键词匹配 - 使用 WHOIS 进行域名年龄验证 - HTTPS/SSL 证书验证 - 邮箱与域名不匹配检测 - 使用 TF-IDF + Logistic Regression 进行 ML 分类 - 风险评分(0-100),分为低/中/高类别 - 危险信号(Red flag)高亮显示 - AI 驱动的建议 ### 2. 虚假公司数据库 - 已知诈骗公司的可搜索数据库 - 诈骗类型分类 - 投诉追踪系统 - 详细的诈骗手法解释 - 用户投诉提交 ### 3. 正规公司名录 - 已验证的公司资料 - 官方网站链接 - 招聘流程信息 - 资格标准 - 申请人安全提示 ### 4. 分析仪表盘 - 总扫描统计 - 风险分布可视化 - 投诉分析 - 最常被搜索的公司 - 使用 Chart.js 的交互式图表 ### 5. 分析历史 - 完整的扫描历史 - 可下载的 PDF 报告 - 历史风险追踪 ### 6. PDF 报告生成器 - 专业的分析报告 - 风险评估详情 - 建议 - 可下载格式 ### 7. 管理面板 - 安全登录系统(用户名:admin,密码:admin123) - 管理虚假公司数据库 - 管理正规公司名录 - 查看和监控投诉 - 系统分析 ## 技术栈 - **后端**: Flask, SQLAlchemy - **数据库**: SQLite - **前端**: HTML5, CSS3, Bootstrap 5, JavaScript - **ML**: scikit-learn (TF-IDF Vectorizer, Logistic Regression) - **其他**: python-whois, reportlab, Chart.js ## 安装 1. 安装依赖项: ``` pip install -r requirements.txt ``` 2. 运行应用程序: ``` python app.py ``` 3. 打开浏览器并访问: ``` http://127.0.0.1:5000 ``` ## 项目结构 ``` fake_job_detector/ ├── app.py # Main Flask application ├── requirements.txt # Python dependencies ├── job_detector.db # SQLite database (auto-created) ├── README.md # Project documentation ├── templates/ # HTML templates │ ├── base.html │ ├── index.html │ ├── analyze.html │ ├── fake_companies.html │ ├── fake_company_detail.html │ ├── genuine_companies.html │ ├── genuine_company_detail.html │ ├── history.html │ ├── analytics.html │ ├── admin_login.html │ ├── admin_dashboard.html │ ├── admin_fake_companies.html │ ├── admin_genuine_companies.html │ └── admin_complaints.html └── static/ ├── css/ │ └── style.css # Dark cybersecurity theme └── js/ └── script.js # Interactive features ``` ## 使用说明 ### 对于用户: 1. 从侧边栏导航至 "Analyze Job"(分析职位) 2. 输入职位详情(描述为必填项) 3. 提交以进行分析 4. 查看风险评分、ML 预测和危险信号 5. 如有需要,下载 PDF 报告 ### 对于管理员: 1. 点击侧边栏中的 "Admin"(管理) 2. 使用凭据登录(admin/admin123) 3. 管理虚假/正规公司 4. 查看投诉和分析数据 ## ML 模型 系统使用 Logistic Regression 分类器进行训练,基于: - **虚假职位指标**:紧急招聘、注册费、个人邮箱、不切实际的承诺 - **正规职位指标**:专业要求、官方渠道、流程透明 **特征**:具有 500 个特征的 TF-IDF 向量化 **准确性**:在平衡数据集上训练,用于二分类 ## 风险评分算法 ``` Risk Score = (Red Flags × 5) + Domain Age Score + HTTPS Score + Email Mismatch Score + ML Score - Red Flags: 5 points each - Domain Age < 180 days: 20 points - No HTTPS: 15 points - Email Mismatch: 20 points - ML Prediction "Fake": 30 points Total: 0-100 (Low: <30, Medium: 30-60, High: >60) ``` ## 安全特性 - 基于会话的管理员身份验证 - 通过 SQLAlchemy ORM 防止 SQL 注入 - 输入验证和清理 - 安全的密码处理(注意:在生产环境中应使用哈希处理) ## 未来改进方向 - 邮箱验证系统 - 公司 Logo 验证 - 社交媒体资料分析 - 用户注册和个性化仪表盘 - 与招聘门户网站的 API 集成 - 高级 NLP 模型(BERT, transformers) ## 致谢 作为 MCA 水平的项目开发,展示了: - 全栈 Web 开发 - 机器学习集成 - 数据库设计与管理 - 安全最佳实践 - 专业的 UI/UX 设计 ## 许可证 用于学术目的的教育项目。
标签:Apex, Bootstrap 5, Chart.js, DAST, ESC8, Flask, HR安全, NLP, PDF报告生成, Python, Scikit-learn, Sigma 规则, SQLAlchemy, SQLite, SSL证书验证, TF-IDF, Web应用开发, WHOIS查询, 云计算, 人工智能, 仪表盘, 协议探测, 反诈骗系统, 域名分析, 威胁情报, 开发者工具, 恶意软件分析, 数据可视化, 数据清洗, 文本分类, 无后门, 机器学习, 欺诈检测, 求职安全, 用户模式Hook绕过, 社会工程学, 社会工程学防御, 网络安全, 网络钓鱼检测, 虚假招聘检测, 规则引擎, 诈骗识别, 逆向工具, 逻辑回归, 隐私保护