MukundaKatta/evalharness
GitHub: MukundaKatta/evalharness
一个用于测试和评估 AI prompt、agent 及 RAG pipeline 的框架,支持回归测试、红队对抗测试和 CI/CD 集成。
Stars: 1 | Forks: 0
# evalharness
**测试你的 prompt、agent 和 RAG pipeline —— 针对 AI 的红队测试、回归测试和 CI/CD**
 
## 安装说明
```
npm install
```
## 快速开始
```
import { Evalharness } from "./evalharness";
const instance = new Evalharness()
const r = await instance.runtest({ input: 'test' })
```
## CLI
```
npx tsx src/cli.ts status
npx tsx src/cli.ts run --input "data"
```
## API
| Method | Description |
|--------|-------------|
| `runtest()` | Runtest |
| `assertcontains()` | Assertcontains |
| `assertsemantic()` | Assertsemantic |
| `redteam()` | Redteam |
| `generatereport()` | Generatereport |
| `comparemodels()` | Comparemodels |
## 测试
```
npx vitest
```
## License
(c) 2026 Officethree Technologies. All Rights Reserved.
标签:AI红队测试, DLL 劫持, LNA, MITM代理, RAG评估, 人工智能, 基线管理, 大语言模型, 暗色界面, 用户模式Hook绕过, 自动化攻击