sidneibarbieri/policy-verifier

GitHub: sidneibarbieri/policy-verifier

一份用于验证策略一致性与审计 LLM 事件响应流程的公开工件包。

Stars: 0 | Forks: 0

# 制品包该包包含匿名数据集、冻结的策略制品以及重现公开分析所需的代码。 ## 环境准备在运行以下检查之前，请在此包内创建并激活虚拟环境。捆绑的 `run.sh` 已暴露打包的 `src/` 树结构，并在存在时自动检测 `.venv/`，因此你只需准备依赖即可。 ``` python3 -m venv .venv source .venv/bin/activate .venv/bin/pip install -r requirements.txt -r requirements-dev.txt ``` ## 推荐验证顺序 ``` bash run.sh validate-public-artifact ``` 这条零成本命令会运行制品完整性检查、数据集审计、全局制品评估以及发布卫生复查，并将新的验证报告写入 `artifact_outputs/analysis/`。 `.venv/` 和 `__pycache__/` 等本地临时文件会被完整性检查忽略。它还会验证 `artifact_outputs/analysis/protocol_freeze.json` 是否指向其 SHA-256 摘要与发布包匹配的文件。公开包不包含付费的官方 LLM 执行套件；其打包时提供的非私有零成本分析输出包括： - 人类基线分析套件 - 复制的官方摘要 - 公开运行会计清单 - 用于审计论文主要聚合结果的公开配对测试摘要如果存在，打包的 `artifact_outputs/analysis/repeat_stability/` 目录还会公开用于论文稳健性讨论的非私有稳定性摘要。读者应将冻结的规则面与观察到的规则切片结合起来理解：官方摘要仅报告针对审批门控规则（`R3`、`R4`）的违规情况。`R1` 仍全局生效，但其触发依赖于一个在冻结事件切片中不存在的反向 Shell 特征签名；`R2` 要求在无更早取证的情况下恢复，而这在报告的冻结中并未发生。 ## 包布局 - `artifact_data/`：匿名化事件数据集与冻结的全局策略输入 - `artifact_outputs/analysis/`：非私有分析输出、公开运行会计、公开配对对比与官方协议清单 - `src/`、`scripts/`、`config/`、`local_redaction/`：可复现代码与冻结映射契约请使用 `ARTIFACT_README.md` 获取包概览，使用 `EVAL_PROTOCOL.md` 获取冻结评估配置。冻结模型注册表记录在 `config/models.freeze.yaml` 中；本地执行覆盖项被有意排除。

标签：Cutter, LLM 代理, Python 依赖, RDFlib, SHA-256 校验, 人工制品包, 人类基线分析, 代码复现, 公共评审, 取证恢复, 可验证AI, 完整性检查, 审查报告, 政策合规, 数据集审计, 自动化验证, 虚拟环境, 规则冻结, 运行分析, 逆向shell, 逆向工具, 重复稳定性, 零成本输出, 非公开数据