ritikkalal07/Redrob-AI
GitHub: ritikkalal07/Redrob-AI
一个确定性的离线候选人排名系统,通过多维结构化信号和淘汰规则为高级 AI 工程师岗位生成可解释的 top-100 候选人短名单。
Stars: 0 | Forks: 0
# 高级 AI 工程师候选人排名器
Redrob 黑客马拉松赛道 01:智能候选人发现(Intelligent Candidate Discovery)的离线排名项目。
该排名器使用结构化的画像信号对高级 AI 工程师候选人进行评分:职位和职业契合度、检索/搜索技能、经验、所在地、教育背景、行为可用性、硬性取消资格条件、蜜罐检查以及事实推理。它在排名过程中不会调用外部 API。
## 主要文件
- `rank.py` - 仅限 CPU 运行的主排名器。
- `validate_and_check.py` - 带有蜜罐警告的强大提交前验证器。
- `validate_submission.py` - 来自官方包的格式验证器。
- `sandbox_app.py` - 用于示例候选人的 Streamlit 演示。
- `candidates.jsonl` - 完整的候选人库,进行完整排名时必需。
- `sample_candidates.json` 和 `data/sample_candidates.json` - 用于检查和沙盒演示的示例画像。
- `submission.csv` - 生成的 top-100 输出文件。
- `submission_metadata.yaml` - 用于提交门户的元数据草案。
- `requirements.txt` - Python 依赖项。
## 环境配置
```
pip install -r requirements.txt
```
## 生成提交结果
```
python rank.py --candidates ./candidates.jsonl --out ./submission.csv
```
## 验证提交结果
```
python validate_and_check.py submission.csv candidates.jsonl
python validate_submission.py submission.csv
```
## 运行沙盒
```
streamlit run sandbox_app.py
```
## 注意事项
- 运行时间目标:在 CPU 上处理 100,000 名候选人不超过 5 分钟。
- 通过流式传输 JSONL 记录并仅保留排名靠前的候选人,保持较低的内存使用量。
- `submission.csv` 是基于本地完整数据集生成的,在排名规则更改后应重新生成。
标签:Kubernetes, Python, Streamlit, 人力资源科技, 数据排序与评估, 数据验证, 无后门, 时序数据库, 简历筛选, 访问控制, 逆向工具