MukundaKatta/evalharness

GitHub: MukundaKatta/evalharness

一个用于测试和评估 AI prompt、agent 及 RAG pipeline 的框架，支持回归测试、红队对抗测试和 CI/CD 集成。

Stars: 1 | Forks: 0

# evalharness **测试你的 prompt、agent 和 RAG pipeline —— 针对 AI 的红队测试、回归测试和 CI/CD** ![Build](https://img.shields.io/badge/build-passing-brightgreen) ![License](https://img.shields.io/badge/license-proprietary-red) ## 安装说明 ``` npm install ``` ## 快速开始 ``` import { Evalharness } from "./evalharness"; const instance = new Evalharness() const r = await instance.runtest({ input: 'test' }) ``` ## CLI ``` npx tsx src/cli.ts status npx tsx src/cli.ts run --input "data" ``` ## API | Method | Description | |--------|-------------| | `runtest()` | Runtest | | `assertcontains()` | Assertcontains | | `assertsemantic()` | Assertsemantic | | `redteam()` | Redteam | | `generatereport()` | Generatereport | | `comparemodels()` | Comparemodels | ## 测试 ``` npx vitest ``` ## License (c) 2026 Officethree Technologies. All Rights Reserved.

标签：AI红队测试, DLL 劫持, LNA, MITM代理, RAG评估, 人工智能, 基线管理, 大语言模型, 暗色界面, 用户模式Hook绕过, 自动化攻击