ritikkalal07/Redrob-AI

GitHub: ritikkalal07/Redrob-AI

一个确定性的离线候选人排名系统,通过多维结构化信号和淘汰规则为高级 AI 工程师岗位生成可解释的 top-100 候选人短名单。

Stars: 0 | Forks: 0

# 高级 AI 工程师候选人排名器 Redrob 黑客马拉松赛道 01:智能候选人发现(Intelligent Candidate Discovery)的离线排名项目。 该排名器使用结构化的画像信号对高级 AI 工程师候选人进行评分:职位和职业契合度、检索/搜索技能、经验、所在地、教育背景、行为可用性、硬性取消资格条件、蜜罐检查以及事实推理。它在排名过程中不会调用外部 API。 ## 主要文件 - `rank.py` - 仅限 CPU 运行的主排名器。 - `validate_and_check.py` - 带有蜜罐警告的强大提交前验证器。 - `validate_submission.py` - 来自官方包的格式验证器。 - `sandbox_app.py` - 用于示例候选人的 Streamlit 演示。 - `candidates.jsonl` - 完整的候选人库,进行完整排名时必需。 - `sample_candidates.json` 和 `data/sample_candidates.json` - 用于检查和沙盒演示的示例画像。 - `submission.csv` - 生成的 top-100 输出文件。 - `submission_metadata.yaml` - 用于提交门户的元数据草案。 - `requirements.txt` - Python 依赖项。 ## 环境配置 ``` pip install -r requirements.txt ``` ## 生成提交结果 ``` python rank.py --candidates ./candidates.jsonl --out ./submission.csv ``` ## 验证提交结果 ``` python validate_and_check.py submission.csv candidates.jsonl python validate_submission.py submission.csv ``` ## 运行沙盒 ``` streamlit run sandbox_app.py ``` ## 注意事项 - 运行时间目标:在 CPU 上处理 100,000 名候选人不超过 5 分钟。 - 通过流式传输 JSONL 记录并仅保留排名靠前的候选人,保持较低的内存使用量。 - `submission.csv` 是基于本地完整数据集生成的,在排名规则更改后应重新生成。
标签:Kubernetes, Python, Streamlit, 人力资源科技, 数据排序与评估, 数据验证, 无后门, 时序数据库, 简历筛选, 访问控制, 逆向工具