Gabe-QA/ai-testing-portfolio
GitHub: Gabe-QA/ai-testing-portfolio
这是一个自动化LLM测试套件,用于检测本地托管AI模型的准确性和安全性问题。
Stars: 0 | Forks: 0
# AI 测试项目 — LLM 行为测试套件
## 概述
这是一个自动化测试套件,它通过 API 使用 LM Studio 直接与本地托管的 AI 模型进行通信。我编写了结构化的 Python 测试用例,通过编程方式发送请求、验证响应并报告通过或失败的结果,而不是手动与 AI 聊天。
该 AI 被配置为一家名为 Bella Italia 的虚构餐厅的客服助手,使用系统提示词进行设定。
## 使用的工具
- Python — 发送 API 请求并编写测试逻辑
- Pytest — 运行并报告测试结果
- LM Studio — 作为 API 服务器在本地托管 Gemma-4
- PyCharm — 用于编写测试套件的 IDE
## 测试类别
- 正向测试 — 验证正确的菜单信息
- 反向测试 — 验证偏题问题被拒绝
- 边界测试 — 验证处理不完整的输入
- 对抗性/提示词注入测试 — 验证系统提示词抵御攻击的能力
- 越狱测试 — 验证创造性的操纵尝试被拒绝
- 一致性测试 — 验证多次请求的答案相同
- 幻觉测试 — 验证 AI 不会编造菜单项
- 语言测试 — 验证强制执行仅使用英语的政策
## 发现的缺陷
空输入会导致内部模板错误,而不是给出优雅的响应。系统会向用户暴露内部错误信息,而不是要求提供有效输入。
## 如何运行
1. 安装 LM Studio 并加载 Gemma-4
2. 启动本地服务器
3. 安装依赖项:pip install pytest requests
4. 运行:pytest test_gemma.py -v
标签:AI测试, API测试, Clair, Gemma-4, LLM测试, LM Studio, Pytest, Python, 一致性测试, 准确性测试, 字符串匹配, 安全测试, 对抗性测试, 幻觉测试, 提示注入测试, 攻击性安全, 无后门, 服务枚举, 本地模型, 模型评估, 正面测试, 测试套件, 行为测试, 语言测试, 负面测试, 软件缺陷, 边缘案例测试, 逆向工具