nitin-manral/AI_BASED_FAKE_OFFER_DETECTION_SYSTEM
GitHub: nitin-manral/AI_BASED_FAKE_OFFER_DETECTION_SYSTEM
基于Flask的虚假招聘检测系统,融合机器学习分类、规则引擎和威胁情报技术,帮助求职者识别欺诈性招聘信息并生成风险评估报告。
Stars: 1 | Forks: 0
# 基于AI的虚假招聘检测系统
本项目利用机器学习和威胁情报技术检测虚假招聘信息和诈骗公司。
它有助于用户识别欺诈性招聘邀约,避免网络诈骗。
## MCA 水平项目
一款专业的 Flask Web 应用程序,结合 AI 和基于规则的检测来识别虚假招聘信息,保护求职者免受诈骗。
## 功能特性
### 1. 智能职位分析器
- 多输入分析(职位链接、描述、公司名称、HR 邮箱)
- 基于规则的检测,支持可疑关键词匹配
- 使用 WHOIS 进行域名年龄验证
- HTTPS/SSL 证书验证
- 邮箱与域名不匹配检测
- 使用 TF-IDF + Logistic Regression 进行 ML 分类
- 风险评分(0-100),分为低/中/高类别
- 危险信号(Red flag)高亮显示
- AI 驱动的建议
### 2. 虚假公司数据库
- 已知诈骗公司的可搜索数据库
- 诈骗类型分类
- 投诉追踪系统
- 详细的诈骗手法解释
- 用户投诉提交
### 3. 正规公司名录
- 已验证的公司资料
- 官方网站链接
- 招聘流程信息
- 资格标准
- 申请人安全提示
### 4. 分析仪表盘
- 总扫描统计
- 风险分布可视化
- 投诉分析
- 最常被搜索的公司
- 使用 Chart.js 的交互式图表
### 5. 分析历史
- 完整的扫描历史
- 可下载的 PDF 报告
- 历史风险追踪
### 6. PDF 报告生成器
- 专业的分析报告
- 风险评估详情
- 建议
- 可下载格式
### 7. 管理面板
- 安全登录系统(用户名:admin,密码:admin123)
- 管理虚假公司数据库
- 管理正规公司名录
- 查看和监控投诉
- 系统分析
## 技术栈
- **后端**: Flask, SQLAlchemy
- **数据库**: SQLite
- **前端**: HTML5, CSS3, Bootstrap 5, JavaScript
- **ML**: scikit-learn (TF-IDF Vectorizer, Logistic Regression)
- **其他**: python-whois, reportlab, Chart.js
## 安装
1. 安装依赖项:
```
pip install -r requirements.txt
```
2. 运行应用程序:
```
python app.py
```
3. 打开浏览器并访问:
```
http://127.0.0.1:5000
```
## 项目结构
```
fake_job_detector/
├── app.py # Main Flask application
├── requirements.txt # Python dependencies
├── job_detector.db # SQLite database (auto-created)
├── README.md # Project documentation
├── templates/ # HTML templates
│ ├── base.html
│ ├── index.html
│ ├── analyze.html
│ ├── fake_companies.html
│ ├── fake_company_detail.html
│ ├── genuine_companies.html
│ ├── genuine_company_detail.html
│ ├── history.html
│ ├── analytics.html
│ ├── admin_login.html
│ ├── admin_dashboard.html
│ ├── admin_fake_companies.html
│ ├── admin_genuine_companies.html
│ └── admin_complaints.html
└── static/
├── css/
│ └── style.css # Dark cybersecurity theme
└── js/
└── script.js # Interactive features
```
## 使用说明
### 对于用户:
1. 从侧边栏导航至 "Analyze Job"(分析职位)
2. 输入职位详情(描述为必填项)
3. 提交以进行分析
4. 查看风险评分、ML 预测和危险信号
5. 如有需要,下载 PDF 报告
### 对于管理员:
1. 点击侧边栏中的 "Admin"(管理)
2. 使用凭据登录(admin/admin123)
3. 管理虚假/正规公司
4. 查看投诉和分析数据
## ML 模型
系统使用 Logistic Regression 分类器进行训练,基于:
- **虚假职位指标**:紧急招聘、注册费、个人邮箱、不切实际的承诺
- **正规职位指标**:专业要求、官方渠道、流程透明
**特征**:具有 500 个特征的 TF-IDF 向量化
**准确性**:在平衡数据集上训练,用于二分类
## 风险评分算法
```
Risk Score = (Red Flags × 5) + Domain Age Score + HTTPS Score + Email Mismatch Score + ML Score
- Red Flags: 5 points each
- Domain Age < 180 days: 20 points
- No HTTPS: 15 points
- Email Mismatch: 20 points
- ML Prediction "Fake": 30 points
Total: 0-100 (Low: <30, Medium: 30-60, High: >60)
```
## 安全特性
- 基于会话的管理员身份验证
- 通过 SQLAlchemy ORM 防止 SQL 注入
- 输入验证和清理
- 安全的密码处理(注意:在生产环境中应使用哈希处理)
## 未来改进方向
- 邮箱验证系统
- 公司 Logo 验证
- 社交媒体资料分析
- 用户注册和个性化仪表盘
- 与招聘门户网站的 API 集成
- 高级 NLP 模型(BERT, transformers)
## 致谢
作为 MCA 水平的项目开发,展示了:
- 全栈 Web 开发
- 机器学习集成
- 数据库设计与管理
- 安全最佳实践
- 专业的 UI/UX 设计
## 许可证
用于学术目的的教育项目。
标签:Apex, Bootstrap 5, Chart.js, DAST, ESC8, Flask, HR安全, NLP, PDF报告生成, Python, Scikit-learn, Sigma 规则, SQLAlchemy, SQLite, SSL证书验证, TF-IDF, Web应用开发, WHOIS查询, 云计算, 人工智能, 仪表盘, 协议探测, 反诈骗系统, 域名分析, 威胁情报, 开发者工具, 恶意软件分析, 数据可视化, 数据清洗, 文本分类, 无后门, 机器学习, 欺诈检测, 求职安全, 用户模式Hook绕过, 社会工程学, 社会工程学防御, 网络安全, 网络钓鱼检测, 虚假招聘检测, 规则引擎, 诈骗识别, 逆向工具, 逻辑回归, 隐私保护