saffronandindia/headlights-oss

GitHub: saffronandindia/headlights-oss

Headlights 是一个基于 IETF Agent Audit Trail 草案的 AI agent 行为审计工具,通过签名哈希链为 agent 的每一次决策生成防篡改的可验证记录。

Stars: 0 | Forks: 0

# Headlights [![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/4f57b92a24115353.svg)](https://github.com/saffronandindia/headlights-oss/actions/workflows/ci.yml) **一份关于你的 AI agent 实际操作行为的防篡改记录。** 当 AI agent 犯错时(总会有一个犯错),部署它的机构几乎从来没有证据来重构该 agent 当时看到了什么、推断出了什么、做了什么,以及是谁授权的。飞机上有飞行记录仪。而生产环境中的 AI agent 却没有。Headlights 正是为填补这一空白而生。 它面向那些必须对生产环境中的 agent 负责的团队:包括构建它的开发者,以及作为其运作后盾的平台、风险和合规负责人。 在你的 agent 运行的 workflow 中安装 SDK,记录 agent 做出的每一个决策,并生成一个经过签名的、仅可追加的链。监管机构、法庭或客户的律师可以在几个月或几年后对其进行验证。开源,无供应商锁定,全程无专有审计员介入。 基于 [Agent Audit Trail 草案](https://datatracker.ietf.org/doc/draft-sharif-agent-audit-trail/) 构建,这是一份尚未被工作组采纳的 IETF 个人提案。采用 Apache 2.0 许可证。关于真实 AI agent 故障的配套实地记录发布在 [useheadlights.com](https://useheadlights.com)。 ## Packages | 路径 | 介绍 | | --- | --- | | [`chain/`](chain/) | 哈希链原语。ECDSA P-256 签名,仅可追加,防篡改。 | | [`sdk-python/`](sdk-python/) | Python SDK,用于从 agent 内部将行为记录写入链中。 | | [`verifier/`](verifier/) | 用于验证任何链导出文件的公开 CLI。无状态。无外部请求。 | | [`server/`](server/) | 参考用的 FastAPI 后端,用于托管链,并提供 trace-viewer endpoint。 | | [`dashboard-reference/`](dashboard-reference/) | 最小化的 Next.js 仪表板,从参考服务器读取数据。 | | [`scorecard/`](scorecard/) | AI 行为记分卡的静态评估标准。 | | [`specs/`](specs/) | 协议规范。包含链格式、决策、记分卡研究及评估标准。 | | [`marketing/`](marketing/) | 内部试用的 agents(发现、起草、上传)。它们在运行时自身也会被记录到 Headlights 链中。 | | [`examples/`](examples/) | 端到端演示。从这里开始入手。 | ## 快速开始 ``` # 从此 repo 的 checkout 开始: pip install -e ./chain ./sdk-python ./verifier ./server # 通过 SDK 生成签名的 conduct chain: python examples/loan_analyser_demo.py # 验证任何 chain export: headlights-verify path/to/chain.json ``` 五分钟即可获得你的第一个证明。 你的 agent 发起的每一次调用都会成为一条*行为记录*:一条经过签名且带有时间戳的条目,用于捕获模型版本、输入、输出和结果。这些记录在每个 session 中链接成一条防篡改的链,这就是以下防护组件所写入并由 verifier 检验的内容。 ## 治理防护组件 在原始记录 API 之上,SDK 提供了一层轻量级的、具名的**治理防护组件**(governance guards):执行前后的检查,每一项都会将其决策记录为有效的 AAT 记录。它们将 [Headlights 事件库](https://useheadlights.com/library) 中记录的失败模式转换为你可运行的代码。共计八个模块,分为两层。 **记录层**(在操作发生后写入):`ConductRecord`、`MetricRecord`。 **网关层**(在操作发生前按顺序执行):`AuthorityGate`、`ConstraintGate`、`PersonaGuard`、`CitationVerifier`、`VerificationGate`、`EgressGate`。 这八个模块现已全部发布,遵循相同的轻量级模式:没有引入新的加密方式,也没有新的记录格式,只是一些委托给该链的具名检查。在该工具包中,之前没有对应物的两个组件是 **AuthorityGate**(指令的来源是否有权约束该 agent?)和 **EgressGate**(是否有敏感数据正在离开信任边界?)。 ``` from headlights_sdk import Client from headlights_sdk.guards import AuthorityGate, EgressGate client = Client(agent_id="urn:org:agent", agent_version="1.0.0") # 拒绝来自未授权绑定 agent 的源的指令。 AuthorityGate(client, authorised_sources={"urn:org:ops-console"}).enforce( source="urn:org:ops-console", instruction="run payroll" ) # 阻止敏感数据离开 trust boundary。 EgressGate( client, trusted_destinations={"https://internal.corp"}, sensitive_patterns={"aws_key": r"AKIA[0-9A-Z]{16}"}, ).enforce(content=reply, destination="https://partner.example") ``` 完整详情请见[防护组件 README](sdk-python/headlights_sdk/guards/README.md),实时模块介绍位于 [useheadlights.com/code](https://useheadlights.com/code)。 ## 状态 发布前的 Alpha 版本 (v0.1.0a1)。哈希链原语、验证器 CLI、SDK(包括新增的治理防护层)、参考服务器、记分卡评估标准以及内部试用的营销 pipeline 均已具备功能,并由测试套件覆盖。托管平台、Web 仪表板的界面优化以及 PyPI 发布仍待后续进行。 与 [Agent Audit Trail 草案](https://datatracker.ietf.org/doc/draft-sharif-agent-audit-trail/) 保持一致,这是一份尚未被工作组采纳的 IETF 个人提案。协议详情请参阅 [`specs/chain.md`](specs/chain.md) 和 [`specs/decisions.md`](specs/decisions.md),行为记分卡请参阅 [`specs/scorecard-rubric.md`](specs/scorecard-rubric.md)。 ## 运行测试 ``` # 以 editable 模式安装所有内容,以便 packages 能够相互看到 pip install -e ./chain ./sdk-python ./verifier ./server # 从 repo 根目录运行完整套件 PYTHONPATH=chain:sdk-python:verifier:server:. python -m pytest -q ``` ## 安全 如果你发现漏洞,请遵循 [SECURITY.md](SECURITY.md) 中的披露流程。请勿针对安全漏洞提交公开的 GitHub issue。 ## 贡献 请参阅 [CONTRIBUTING.md](CONTRIBUTING.md) 和 [CODE_OF_CONDUCT.md](CODE_OF_CONDUCT.md)。 ## 许可证 Apache 2.0,版权所有 Stellae Consulting Pty Ltd。请参阅 [LICENSE](LICENSE)。
标签:人工智能, 合规追踪, 哈希链, 智能体审计, 用户模式Hook绕过, 逆向工具, 防篡改