saffronandindia/headlights-oss

GitHub: saffronandindia/headlights-oss

Headlights 是一个基于 IETF Agent Audit Trail 草案的 AI agent 行为审计工具，通过签名哈希链为 agent 的每一次决策生成防篡改的可验证记录。

Stars: 0 | Forks: 0

# Headlights [![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/4f57b92a24115353.svg)](https://github.com/saffronandindia/headlights-oss/actions/workflows/ci.yml) **一份关于你的 AI agent 实际操作行为的防篡改记录。** 当 AI agent 犯错时（总会有一个犯错），部署它的机构几乎从来没有证据来重构该 agent 当时看到了什么、推断出了什么、做了什么，以及是谁授权的。飞机上有飞行记录仪。而生产环境中的 AI agent 却没有。Headlights 正是为填补这一空白而生。它面向那些必须对生产环境中的 agent 负责的团队：包括构建它的开发者，以及作为其运作后盾的平台、风险和合规负责人。在你的 agent 运行的 workflow 中安装 SDK，记录 agent 做出的每一个决策，并生成一个经过签名的、仅可追加的链。监管机构、法庭或客户的律师可以在几个月或几年后对其进行验证。开源，无供应商锁定，全程无专有审计员介入。基于 [Agent Audit Trail 草案](https://datatracker.ietf.org/doc/draft-sharif-agent-audit-trail/) 构建，这是一份尚未被工作组采纳的 IETF 个人提案。采用 Apache 2.0 许可证。关于真实 AI agent 故障的配套实地记录发布在 [useheadlights.com](https://useheadlights.com)。 ## Packages | 路径 | 介绍 | | --- | --- | | [`chain/`](chain/) | 哈希链原语。ECDSA P-256 签名，仅可追加，防篡改。 | | [`sdk-python/`](sdk-python/) | Python SDK，用于从 agent 内部将行为记录写入链中。 | | [`verifier/`](verifier/) | 用于验证任何链导出文件的公开 CLI。无状态。无外部请求。 | | [`server/`](server/) | 参考用的 FastAPI 后端，用于托管链，并提供 trace-viewer endpoint。 | | [`dashboard-reference/`](dashboard-reference/) | 最小化的 Next.js 仪表板，从参考服务器读取数据。 | | [`scorecard/`](scorecard/) | AI 行为记分卡的静态评估标准。 | | [`specs/`](specs/) | 协议规范。包含链格式、决策、记分卡研究及评估标准。 | | [`marketing/`](marketing/) | 内部试用的 agents（发现、起草、上传）。它们在运行时自身也会被记录到 Headlights 链中。 | | [`examples/`](examples/) | 端到端演示。从这里开始入手。 | ## 快速开始 ``` # 从此 repo 的 checkout 开始： pip install -e ./chain ./sdk-python ./verifier ./server # 通过 SDK 生成签名的 conduct chain： python examples/loan_analyser_demo.py # 验证任何 chain export： headlights-verify path/to/chain.json ``` 五分钟即可获得你的第一个证明。你的 agent 发起的每一次调用都会成为一条*行为记录*：一条经过签名且带有时间戳的条目，用于捕获模型版本、输入、输出和结果。这些记录在每个 session 中链接成一条防篡改的链，这就是以下防护组件所写入并由 verifier 检验的内容。 ## 治理防护组件在原始记录 API 之上，SDK 提供了一层轻量级的、具名的**治理防护组件**（governance guards）：执行前后的检查，每一项都会将其决策记录为有效的 AAT 记录。它们将 [Headlights 事件库](https://useheadlights.com/library) 中记录的失败模式转换为你可运行的代码。共计八个模块，分为两层。 **记录层**（在操作发生后写入）：`ConductRecord`、`MetricRecord`。 **网关层**（在操作发生前按顺序执行）：`AuthorityGate`、`ConstraintGate`、`PersonaGuard`、`CitationVerifier`、`VerificationGate`、`EgressGate`。这八个模块现已全部发布，遵循相同的轻量级模式：没有引入新的加密方式，也没有新的记录格式，只是一些委托给该链的具名检查。在该工具包中，之前没有对应物的两个组件是 **AuthorityGate**（指令的来源是否有权约束该 agent？）和 **EgressGate**（是否有敏感数据正在离开信任边界？）。 ``` from headlights_sdk import Client from headlights_sdk.guards import AuthorityGate, EgressGate client = Client(agent_id="urn:org:agent", agent_version="1.0.0") # 拒绝来自未授权绑定 agent 的源的指令。 AuthorityGate(client, authorised_sources={"urn:org:ops-console"}).enforce( source="urn:org:ops-console", instruction="run payroll" ) # 阻止敏感数据离开 trust boundary。 EgressGate( client, trusted_destinations={"https://internal.corp"}, sensitive_patterns={"aws_key": r"AKIA[0-9A-Z]{16}"}, ).enforce(content=reply, destination="https://partner.example") ``` 完整详情请见[防护组件 README](sdk-python/headlights_sdk/guards/README.md)，实时模块介绍位于 [useheadlights.com/code](https://useheadlights.com/code)。 ## 状态发布前的 Alpha 版本 (v0.1.0a1)。哈希链原语、验证器 CLI、SDK（包括新增的治理防护层）、参考服务器、记分卡评估标准以及内部试用的营销 pipeline 均已具备功能，并由测试套件覆盖。托管平台、Web 仪表板的界面优化以及 PyPI 发布仍待后续进行。与 [Agent Audit Trail 草案](https://datatracker.ietf.org/doc/draft-sharif-agent-audit-trail/) 保持一致，这是一份尚未被工作组采纳的 IETF 个人提案。协议详情请参阅 [`specs/chain.md`](specs/chain.md) 和 [`specs/decisions.md`](specs/decisions.md)，行为记分卡请参阅 [`specs/scorecard-rubric.md`](specs/scorecard-rubric.md)。 ## 运行测试 ``` # 以 editable 模式安装所有内容，以便 packages 能够相互看到 pip install -e ./chain ./sdk-python ./verifier ./server # 从 repo 根目录运行完整套件 PYTHONPATH=chain:sdk-python:verifier:server:. python -m pytest -q ``` ## 安全如果你发现漏洞，请遵循 [SECURITY.md](SECURITY.md) 中的披露流程。请勿针对安全漏洞提交公开的 GitHub issue。 ## 贡献请参阅 [CONTRIBUTING.md](CONTRIBUTING.md) 和 [CODE_OF_CONDUCT.md](CODE_OF_CONDUCT.md)。 ## 许可证 Apache 2.0，版权所有 Stellae Consulting Pty Ltd。请参阅 [LICENSE](LICENSE)。

标签：人工智能, 合规追踪, 哈希链, 智能体审计, 用户模式Hook绕过, 逆向工具, 防篡改