sidneibarbieri/policy-verifier
GitHub: sidneibarbieri/policy-verifier
一份用于验证策略一致性与审计 LLM 事件响应流程的公开工件包。
Stars: 0 | Forks: 0
# 制品包
该包包含匿名数据集、冻结的策略制品以及重现公开分析所需的代码。
## 环境准备
在运行以下检查之前,请在此包内创建并激活虚拟环境。
捆绑的 `run.sh` 已暴露打包的 `src/` 树结构,并在存在时自动检测 `.venv/`,因此你只需准备依赖即可。
```
python3 -m venv .venv
source .venv/bin/activate
.venv/bin/pip install -r requirements.txt -r requirements-dev.txt
```
## 推荐验证顺序
```
bash run.sh validate-public-artifact
```
这条零成本命令会运行制品完整性检查、数据集审计、全局制品评估以及发布卫生复查,并将新的验证报告写入 `artifact_outputs/analysis/`。
`.venv/` 和 `__pycache__/` 等本地临时文件会被完整性检查忽略。
它还会验证 `artifact_outputs/analysis/protocol_freeze.json` 是否指向其 SHA-256 摘要与发布包匹配的文件。
公开包不包含付费的官方 LLM 执行套件;其打包时提供的非私有零成本分析输出包括:
- 人类基线分析套件
- 复制的官方摘要
- 公开运行会计清单
- 用于审计论文主要聚合结果的公开配对测试摘要
如果存在,打包的 `artifact_outputs/analysis/repeat_stability/` 目录还会公开用于论文稳健性讨论的非私有稳定性摘要。
读者应将冻结的规则面与观察到的规则切片结合起来理解:官方摘要仅报告针对审批门控规则(`R3`、`R4`)的违规情况。`R1` 仍全局生效,但其触发依赖于一个在冻结事件切片中不存在的反向 Shell 特征签名;`R2` 要求在无更早取证的情况下恢复,而这在报告的冻结中并未发生。
## 包布局
- `artifact_data/`:匿名化事件数据集与冻结的全局策略输入
- `artifact_outputs/analysis/`:非私有分析输出、公开运行会计、公开配对对比与官方协议清单
- `src/`、`scripts/`、`config/`、`local_redaction/`:可复现代码与冻结映射契约
请使用 `ARTIFACT_README.md` 获取包概览,使用 `EVAL_PROTOCOL.md` 获取冻结评估配置。冻结模型注册表记录在 `config/models.freeze.yaml` 中;本地执行覆盖项被有意排除。
标签:Cutter, LLM 代理, Python 依赖, RDFlib, SHA-256 校验, 人工制品包, 人类基线分析, 代码复现, 公共评审, 取证恢复, 可验证AI, 完整性检查, 审查报告, 政策合规, 数据集审计, 自动化验证, 虚拟环境, 规则冻结, 运行分析, 逆向shell, 逆向工具, 重复稳定性, 零成本输出, 非公开数据