ckxleung/AlphaGuard-Framework
GitHub: ckxleung/AlphaGuard-Framework
面向金融 AI 的机构级确定性评估框架,通过多层审计内核对 LLM 生成的金融、合规与策略内容进行溯源验证和质量审计。
Stars: 1 | Forks: 0
# AlphaGuard 框架
AlphaGuard 是一个确定性评估框架,用于审计 AI 生成的金融、合规性、遥测和策略工件。
支持的运行时:Python 3.10 到 3.13。目前不支持 Python 3.14,因为安全的 LiteLLM 依赖项声明了 `<3.14`。
## 当前仓库状态
本仓库包含在实现各个评估内核之前所需的工程契约:
- 一个抽象的 `BaseAuditor.execute_audit()` 接口;
- 一个故障安全(fail-closed)的机构计分卡 schema;
- 四个必需的内核层;
- 一个外部的 56 家企业遥测配置;
- 一个涵盖模块 ID 1 到 18 的不可变注册表;
- 一个机器可读的规范目录,涵盖每个模块的输入、确定性规则、容差策略、拒绝条件、输出和数据边界;
- 一个针对受监控企业群的同期群和事件驱动监控控制平面;
- 一个在 04:00 HKT 运行的每日 GitHub Actions 遥测工作流;
- 一个支持 DST 的三市场时间戳矩阵;
- 一个机器可验证的机构发布契约;
- 一个由 SHA-256 支持的源文档注册表,包含精确的引文定位符;
- 占位符和结构验证;
- 一个单命令 pipeline 入口点。
修复后的源规范现在定义了全部 18 个唯一的模块代码。
FITV、IRTA、BMAE、CFIA、SCGV 和 IBDV 已被实现并注册;其余 12 个模块具有完整的规范契约,但在其可执行审计器和对抗性测试夹具(fixtures)被实现之前,仍明确保持为 `SPECIFIED` 状态。
## 必需结构
```
evaluation_kernels/
layer_1_telemetry/
Module_05_SFRA/
Module_06_TLAB/
Module_10_OAPE/
layer_2_valuation/
Module_02_APAC/
Module_09_FITV/
Module_11_CVIB/
Module_14_CFIA/
Module_18_IBDV/
layer_3_compliance/
Module_01_FRTE/
Module_08_FOAS/
Module_16_AMWE/
Module_17_ERCA/
layer_4_strategy/
Module_03_AMDG/
Module_04_CASS/
Module_07_BLSB/
Module_12_IRTA/
Module_13_BMAE/
Module_15_SCGV/
config/
enterprise_monitoring_profiles.json
event_routing_policy.json
source_registry.json
target_enterprises.json
schemas/
publication_artifact.schema.json
source_registry.schema.json
templates/
telemetry_note.md
deep_dive_whitepaper.md
src/
base_auditor.py
kernel_spec_catalog.py
main_pipeline.py
market_clock.py
monitoring_control_plane.py
module_manifest.py
output_standard.py
repository_validator.py
source_registry.py
telemetry_router.py
tests/
docs/
.github/workflows/
ci.yml
daily_telemetry_cron.yml
```
## 快速开始
```
python3 -m unittest discover -s tests -p "test_*.py"
python3 -m src.repository_validator
python3 -m src.main_pipeline --validate-only
python3 src/main_pipeline.py
python3 src/monitoring_control_plane.py --event examples/monitoring_event.example.json
python3 src/monitoring_control_plane.py --event examples/monitoring_event.rate_shock.synthetic.json --module-payloads examples/module_payloads.rate_shock.synthetic.json
python3 src/monitoring_control_plane.py --portfolio-baseline
python3 src/output_standard.py examples/publication_artifact.example.json
python3 src/source_registry.py config/source_registry.json
```
覆盖率验证:
```
python3 -m pip install -r requirements-dev.txt
python3 -m coverage run --source=src,evaluation_kernels -m unittest discover -s tests
python3 -m coverage report --fail-under=80
```
标准公式和拒绝契约记录在 [`docs/MASTER_SPEC.md`](docs/MASTER_SPEC.md) 中。
相应的 CI 可验证记录位于 [`src/kernel_spec_catalog.py`](src/kernel_spec_catalog.py) 中。
实现顺序和晋升门控记录在 [`docs/KERNEL_IMPLEMENTATION_ROADMAP.md`](docs/KERNEL_IMPLEMENTATION_ROADMAP.md) 中。
已实现的会计内核使用明确的、已识别来源的输入。它们不下载市场数据,不替换编造的后备值,也不会静默地将缺失字段转换为零。外部摄取适配器必须在调用内核之前对财务报表进行规范化和溯源。
## 每日遥测循环
`.github/workflows/daily_telemetry_cron.yml` 中的计划工作流每天 04:00 HKT 运行。它验证仓库,生成一个仅用于规划的 56 家企业基准工件,并运行确定性合成冒烟测试。该计划绝不声称发生了实时收集或审计。
监控控制平面将三个业务同期群与四个功能基础设施层结合在一起。每日基准路由精确指定两个模块;事件驱动的峰值路由在三到五个之间。已选择但未实现的内核保持可见,状态为 `unavailable_modules`,而没有证据负载(payload)的已实现内核则被报告为已跳过。参见 [`docs/MONITORING_OPERATIONS.md`](docs/MONITORING_OPERATIONS.md)。
目标范围目前包含 56 个受监控的股票代码。
## 机构输出契约
AlphaGuard 发布是一个双文件契约:
1. 从批准的模板创建的人类可读 Markdown 报告;
2. 包含声明、来源、时间戳、计分卡和披露信息的机器可读 JSON 侧档(sidecar)。
标准的编辑和证据规范记录在 [`docs/OUTPUT_STANDARD.md`](docs/OUTPUT_STANDARD.md) 中。机器 schema 位于 [`schemas/publication_artifact.schema.json`](schemas/publication_artifact.schema.json)。
包含合成数据的示例已被明确标记,并且必须在发布前通过 `src/output_standard.py`。
源文档的注册独立于报告引文。该注册表存储稳定的文档 ID、发布者元数据、检索时间戳、SHA-256 快照哈希以及原始来源分类。每个报告引文都会添加一个精确的页码、章节、表格、附录、段落、单元格、时间戳、行或 JSON 指针定位符。参见 [`docs/SOURCE_REGISTRY.md`](docs/SOURCE_REGISTRY.md)。
## 跨市场时间完整性
每次冒烟运行和发布工件都带有一个同步的 UTC、纽约、香港和上海时间戳矩阵。纽约 EST/EDT 转换由标准库 `zoneinfo` 数据库处理。计划的市场状态包括盘前、常规交易时段、午休、收盘集合竞价、盘后和周末闭市。
当前引擎有意声明 `calendar_basis: WEEKDAY_SCHEDULE_ONLY`;交易所假期和临时闭市不作为已解决状态呈现。参见 [`docs/TEMPORAL_STANDARD.md`](docs/TEMPORAL_STANDARD.md)。
## 内核契约
每个生产内核必须:
1. 位于其分配的层下;
2. 定义在 `src/module_manifest.py` 中注册的类;
3. 继承自 `BaseAuditor`;
4. 实现 `execute_audit(ai_output, ground_truth)`;
5. 返回一个包含 `rigor_score`、`data_quality_status` 和 `structured_written_feedback` 的计分卡;
6. 不包含任何占位符实现;
7. 附带确定性的单元、集成和边界测试。
## 交付规则
只有在模块的输入 schema、确定性方程或监管规则、容差策略、测试夹具(fixtures)和实现路径全部经过审查和测试之后,该模块才能从 `SPECIFIED` 更改为 `IMPLEMENTED`。
`SPECIFIED` 意味着该模块在 `src/kernel_spec_catalog.py` 中有一个完整的条目;这并不意味着存在可执行的内核代码。
下一个推荐的构建目标是 `CVIB`,它将围绕实时的 `FITV`、`CFIA` 和 `IBDV` 估值审计器完成 Wave 1。
## 开源核心安全边界
AlphaGuard 不包含生产 API 凭据、许可数据源或机密的机构数据集。实时连接器必须单独提供,并具有明确的来源和密钥管理。本仓库不声称未公开的私有云基础设施已部署。
标签:DLL 劫持, Python, 人工智能, 大语言模型, 属性图, 无后门, 模型评估, 用户模式Hook绕过, 逆向工具, 金融科技