rozmiarD/ravenclaw
GitHub: rozmiarD/ravenclaw
一个以治理为先的安全研究运行时,通过策略门控、审批机制和契约证据链实现受边界约束、可审计的安全工作流编排与执行。
Stars: 0 | Forks: 0
# RAVENCLAW
[](https://github.com/rozmiarD/ravenclaw/actions/workflows/pytest.yml)
[](LICENSE)
[](pyproject.toml)
[](pyproject.toml)
[](https://github.com/rozmiarD/SCLite)
**RAVENCLAW 是一个以治理为先的安全研究运行时,用于受边界约束、可审计的安全操作。**
项目所有者:**Krzysztof Probola**。
它的核心理念很简单:
高级自主性只有在保持受边界约束、可观察和可问责时才有用。
## Ravenclaw 的功能
Ravenclaw 是一个多层运行时,用于在显式治理下运行安全工作流。
它结合了:
- 确定性规划和运行时契约
- 执行前的策略和审批门控
- 通过专用执行引擎进行受约束的执行
- 面向产物的分析和以证据为导向的评估
- 通过 Logdash 面向操作员的可见性
目标不是最大程度的自动化。
目标是在治理下实现可靠的自主性。
公共仓库应被视为该系统的**公共核心**:
一个可发布的运行时/控制面产物,具有显式的治理和验证面,而不是声称每个私有操作员集成都捆绑在这里。
## 独特之处
Ravenclaw 的定位不是一个无约束的“AI黑客”。
它的核心设计主张与众不同:
- 规划、授权、执行和解释是分离的
- 策略在运行时路径中强制执行,而不仅仅是在提示或文档中描述
- 对于敏感操作,操作员的审批仍然是显式的
- 证据质量和可重放性与动作生成同等重要
简而言之,Ravenclaw 优化的是受边界约束的实用性,而不是原始的自主性表演。
Ravenclaw 现在引入了 **GovEngine** 用于可复用的受治理执行辅助工具,以及 **SCLite** 用于契约生命周期产物。
当前的可复用方向是一个小型的**安全契约层(Security Contract Layer)**,由 Ravenclaw 运行时产物提供支持:范围绑定、策略决策、已准备/已批准的执行规范、执行回执、证据摘要和运行时真值。可复用的契约核心现在是独立的 `sclite` 包/仓库,而 Ravenclaw 将其作为受治理的参考运行时引入。OpenClaw、MCP 和 A2A 是这些契约未来潜在的载体,而不是 Ravenclaw 试图拥有的新协议。
## 安全快速入门
当前官方的公共安全路径是面向本地和 dry-run(试运行)的。
推荐顺序:
1. `INSTALL.md`
2. `ENVIRONMENT_SUPPORT.md`
3. `DEMO.md`
4. `VALIDATION.md` / `PROOF_OF_VALUE.md`
5. `QUALITY_SIGNALS.md`
6. `PUBLIC_STATUS.md`
7. `AUDIENCE.md`
8. `DOCS_MAP.md`
9. `PUBLISHING.md`
10. `ARCHITECTURE_OVERVIEW.md`
这条路径有意保持狭窄和诚实。
它通过一个小型的一键演示入口(`bin/demo`)、一个共享的引导路径(`scripts/bootstrap_public_demo.sh`)和显式的 `RAVENCLAW_MODE=demo` 交付配置文件展示了受治理的流程,而不会假装该仓库已经拥有一个完善的一键公共部署方案。
## 架构概览
高级受治理流程:
`范围/输入 -> 规划器 -> 策略门控 / 审计器 -> 已批准的执行规范 -> 执行引擎 -> 分析 -> 操作员可见性`
主要运行时层:
- **Planner(规划器)**:将范围和操作员输入转换为结构化的活动/运行时意图
- **Policy gate / Auditor(策略门控 / 审计器)**:在执行前强制执行范围、工具、授权和激进度规则
- **Execution engine(执行引擎)**:唯一允许构建和运行最终命令的层
- **Analysis / qualification(分析 / 评估)**:将原始产物转化为有边界的发现和摘要
- **Logdash**:面向操作员的控制面,用于可见性、控制和状态真值
简要版本请参阅 `ARCHITECTURE_OVERVIEW.md`,深度结构图请参阅 `ARCHITECTURE.md`。
## 公共成熟度和状态
Ravenclaw 不是一个成熟度扁平的仓库。
某些部分足够稳定,可以被视为强大的公共参考面,而其他部分仍然是实验性的或仅限本地/内部使用。
请使用 `PUBLIC_STATUS.md` 作为规范的公共成熟度指南。
有关公共证明和信任面,请使用 `VALIDATION.md`、`QUALITY_SIGNALS.md` 和 `references/public-safe-proof-walkthrough.md`。
有关公共核心/私有覆盖的划分,请阅读 `references/public-core-private-overlay-boundary.md`。
有关可信核心的授权边界、故障模式和非保证事项,请阅读 `THREAT_MODEL.md`。
有关新兴的契约层,请阅读 `SECURITY_CONTRACT_LAYER.md` 和 `references/approved-execution-spec-v0.1.md`。
有关 Logdash 面向操作员的控制/恢复语义,请参阅 `references/logdash-operator-truth-contracts.md`。
## 安装和运行姿态
最快的公共安全启动方式:
```
./scripts/bootstrap_public_demo.sh demo
```
可复用的公共演示包:
```
./scripts/bootstrap_public_demo.sh bundle
```
有关容器化的公共演示启动,请参阅 `.devcontainer/` 和 `compose.demo.yaml`。
如今,该仓库最强大的定位是:
- 一个以治理为先的运行时架构
- 一个具有真实控制和策略面的研究平台
- 一个可以严肃审查的代码库
它现在拥有一个官方的公共安全本地 dry-run 路径,但尚未达到其最终的最低摩擦形态。
这一剩余差距是真实存在的,仍然是一个活跃的优先事项。
## 目标受众
Ravenclaw 最适合在以下方面有技术追求的严谨读者:
- 以治理为先的安全自动化
- 策略门控执行
- 操作员可见的控制和恢复
- 面向契约的运行时设计
- 证据和可重放性
如果您想要更清晰的匹配/不匹配指南,请阅读 `AUDIENCE.md`。
## 限制和非目标
Ravenclaw **不是**:
- 一个无约束的攻击性自动化平台
- 一个黑盒自主攻击者
- 操作员判断的替代品
- 安全结果的保证
- 一个完善的消费级产品
- 一个面向初学者的安全入门套件
它旨在用于授权的安全研究和受控环境。
其价值取决于受边界约束的行为、显式的治理和操作员的可见性。
## 项目存在的原因
许多自主安全系统以以下两种方式之一失败:
- 它们过于僵化,无法保持实用性
- 或者过于不受约束,无法被信任
Ravenclaw 探索了第三条道路:
智能组件可以提出建议并进行调整,但执行仍受策略约束、可检查且可恢复。
有关简短的公开论述,请阅读 `WHY_RAVENCLAW.md`。
## 仓库指南
主要区域:
- `engine/` - 规划、运行时编排、策略、执行、评估、评价
- `logdash/` - 面向操作员的仪表板和控制面
- `tests/` 和 `engine/tests/` - 回归和契约覆盖
- `references/` - 重要契约和边界的简短参考文档
- `implementation-plans/` - 用于有意义的仓库/运行时改进浪潮的受边界约束的计划
## 发布和公开发布框架
版本里程碑在 `VERSION_ROADMAP.md` 中跟踪。
高级别的开源/公开发布方向在 `OPEN_SOURCE_1_0_PLAN.md` 中跟踪。
当前的公开真相:
- 技术核心强大且严肃
- 公共仓库最好被理解为一个以治理为先的公共核心,而不是一个完整的私有操作员环境
- 公共仓库的形态正在改善,但仍在有条不紊地进行提升
- 公共清晰度、官方可演示性和证明表面比以前有了实质性改善,但仍是持续提升路径的一部分
## 文档地图
基于意图的导航,请使用 `DOCS_MAP.md`。
最终发布工作流,请使用 `PUBLISHING.md`。
## 深入阅读
如果您想要更多深度,请按以下顺序阅读:
1. `PUBLIC_STATUS.md`
2. `AUDIENCE.md`
3. `QUALITY_SIGNALS.md`
4. `VALIDATION.md`
5. `DOCS_MAP.md`
6. `ARCHITECTURE_OVERVIEW.md`
7. `WHY_RAVENCLAW.md`
8. `ARCHITECTURE.md`
9. `STATE_FILES.md`
10. `OPEN_SOURCE_1_0_PLAN.md`
Ravenclaw 应该被理解为治理下的智能体:足够自适应以保持实用性,同时受到足够的约束以保持可检查和值得信赖。
标签:AI安全, API集成, Chat Copilot, Lerna, Python, SCLite, 可观测性, 安全合规, 安全工作流, 安全规则引擎, 安全运行时, 审批机制, 审计追踪, 密码管理, 执行引擎, 无后门, 治理优先, 确定性规划, 策略执行, 策略网关, 网络代理, 自动化控制平面, 证据分析, 试运行, 请求拦截, 边界约束, 运行时合约