sriram98669704/llm-eval-lab
GitHub: sriram98669704/llm-eval-lab
LLM评估实验室,用于评估和比较机器学习模型。
Stars: 0 | Forks: 0
# LLM 评估实验室
## 为什么这个项目
旨在开发对 LLM 在能力上的差异有深入、实际的理解——而不仅仅是营销声明。目标是创建一个工具,能够给出诚实、可重复的答案:*"针对我的特定用例,我应该实际使用哪个模型?"*
## 许可证
MIT
标签:Apex, Claude, CVE检测, Gemini, Kubernetes, MIT 许可, OpenAI, Streamlit, 事实评估, 代码评估, 内存规避, 创意评估, 动态注入, 数学评估, 机器学习, 模型比较, 比较分析, 用户界面, 访问控制, 评估工具, 语言模型, 边缘案例评估, 运行历史记录, 逆向工具