Mad-River-AI/agent-specs

GitHub: Mad-River-AI/agent-specs

一个采用「规范即代码」理念的开源情报AI智能体定义仓库,通过版本化的配置文件管理Agent的提示词、工具权限和评估场景,实现可审查、可复现、可审计的Agent工程化治理。

Stars: 0 | Forks: 0

# agent-specs 这是整个操作的“大脑”。如果说 [`osint-framework`](../osint-framework) 是 runtime,那么这个仓库就是被加载 *进* runtime 的规范。请把这些文件视为**带有版本的**、**可审查的**、**可 diff 的** —— 它们就是最终产品。 🔗 https://madriverai.com  ·  🐙 https://github.com/Mad-River-AI ## 这里存放了什么 ``` agent-specs/ ├── agents/ # named agent definitions (one folder each) │ ├── company-investigator/ │ │ ├── agent.yaml # identity, goal, constraints │ │ ├── system.md # system prompt │ │ ├── tools.yaml # which tools it can call │ │ ├── eval.yaml # test scenarios │ │ └── notes.md # design rationale │ ├── domain-recon/ │ ├── leak-triage/ │ └── ... ├── shared/ # prompt fragments, style guides, personas ├── evals/ # cross-agent eval suite └── CHANGELOG.md # semver of every agent version ``` ## Agent 定义格式 (v0.1) 一个完整的 agent 是**一个文件夹**,包含以下文件: - `agent.yaml` — 机器可读的元数据:名称、版本、所有者、状态、标签 - `system.md` — 实际的 system prompt,为了可读性而采用 markdown 编写 - `tools.yaml` — 允许该 agent 调用哪些工具(来自 `osint-framework/tools/`),以及针对每个工具的约束 - `eval.yaml` — 至少 3 个测试场景:一个 happy path、一个边缘情况,以及一个拒绝/限制情况 - `notes.md` — 人类可读的描述文字:该 agent 的用途、*何时不*该使用它、已知的失败模式 ## 名单(计划中) | agent | 用途 | 状态 | |---|---|---| | `company-investigator` | 给定名称或域名,生成结构化的公司档案(高管、备案文件、网络足迹、风险信号) | 起草中 | | `domain-recon` | WHOIS/DNS/社交媒体账号排查,品牌冲突检查,停放/出售信号 | 构建中(参见 `~/AppData/Local/hermes/scripts/madriverai-recon.py`) | | `leak-triage` | 给定一段 paste、文件或文档,进行分类 + 验证 + 敏感度评分 | 计划中 | | `person-trace` | 给定姓名 + 上下文,构建公开来源的档案(社交媒体、法院记录、商业信息) | 计划中 | | `meta-agent` | 负责挑选 agent 和 pipeline 以实现目标的编排者 | 研究中 | ## 状态 🚧 **Pre-alpha.** 第一个 agent(`domain-recon`)已经每晚针对 `madriverai.com` 运行,目前正在进行通用化改造。`company-investigator` 是下一个目标。 ## 为什么将规范视为代码(specs-as-code)? 因为: - **可审查。** 针对单个 agent spec 提交的 PR 就是一个工作单元。审查者可以阅读 diff 并评判这个 agent 是变笨了还是变聪明了。 - **可复现。** 给定相同的 spec + 相同的工具,同一个 agent 就会以相同的方式运行。 - **可审计。** “为什么 agent 做了 X?” → 打开 spec,查看 prompt + 工具列表即可。 - **可替换。** Spec 并不与单一模型绑定。相同的 YAML 可以运行在 MiniMax、Claude、GPT 或本地 Ollama 上。 ## License MIT。详见 [LICENSE](LICENSE)。 ## 联系方式 - Issues:本仓库 - 所有者:[@muzzy111](https://github.com/muzzy111)、[@trip7s](https://github.com/trip7s) *在印第安纳州编写规范。运行在预算所能承受的任何模型之上。*
标签:AI智能体, ESC4, OSINT, 人工智能, 提示词工程, 用户定义反射加载器, 用户模式Hook绕过, 策略决策点, 自动化框架, 逆向工具, 镜像安全, 防御加固