NullRabbitLabs/nr-substrate-paper

GitHub: NullRabbitLabs/nr-substrate-paper

该论文提出迭代泄漏面剥离方法论，通过预注册阈值与多层可证伪性鉴别器，系统性暴露并修正ML检测区块链验证器DoS攻击中的伪高指标问题。

Stars: 0 | Forks: 0

# 迭代泄漏面剥离 *一种以可证伪性为锚定的方法论，用于 ML 检测区块链验证器基础设施攻击。* **作者**：Simon Morley, NullRabbit **状态**：工作草案 (2026-05-06)。更新将直接发布在 `paper.md` 中；当 arXiv 提交发布时，将推出 v1 预印本。 ## 摘要公网可达的区块链验证器基础设施是不对称资源消耗攻击的诱人目标；通过 2024–2026 年的协调披露管道，涉及 Sui、Solana、 Ethereum、Aptos 和 Cosmos 系链的验证器 DoS 发现已稳步积累。对于在此威胁面上建立监控的运营商而言，能够经受住明文 / TLS 前端边界、跨链传输以及实验室 / 主网保真度层级考验的检测是不可或缺的。然而，基于 ML 的此类攻击检测在发布时，通常在交叉验证折叠中表现出等于或接近 1.000 的中位 ROC-AUC，但在审计时证明这属于伪像，而非反映了底层的网络行为 [sommer2010outside, arp2022dosdonts]。我们的 V1 训练器针对初始 1,092 包 Sui 验证器 DoS 语料库的首份 TrainReport 是该模式下的一个新数据点：在所有 17 个留一基元出折叠中 ROC = 1.000，这是由随机高斯特征的 ROC = 1.000（LOPO 良性保留集污染）和 `resp.count` 的 ROC = 1.000（捕获管道共线性）所驱动的。本文提出了**迭代泄漏面剥离**：这是一种在最终数据出炉之前预注册数值阈值、结构预测和结果带组合规则的方法论，随后通过多层可证伪性鉴别器和审计驱动的迭代来暴露并修正其自身的失效模式。在针对 2,103 包 Sui+Solana 语料库的 V1 → V7-narrow 过程中，该方法论按顺序暴露并消除了八个独立的泄漏面。两大开放支柱支撑了该方法论：**Bundle v1**，一种具有受控词汇来源字段的多模态捕获格式，通过三项已落地的模式累加扩展进行了演示；以及一个包含十种攻击家族外加良性的**链无关家族分类法**，能够在不进行扩展的情况下对循环后攻击进行分类。技术核心是 V7-narrow 多机制发现：该领域中跨链机制的不可转移性是 **特征局部化的，而非针对整个特征空间**。在 V7-narrow 评估门处的头条结果是联合 C（在速率不变的 13 特征清单层级的跨链机制声明，在实验室保真度下被证伪）。随后的 Step-11 V1 + V8 重训练周期在密码无关声明上交付了联合 A：在两种 LOPO 体制下的两条链上，相对于预注册的 Step-11 V1 明文基线实现了 100% 的保留率（Step-11 V1 重训练），并且在移除了受 V7-narrow §SE3 影响的 `pcap.mean_packet_size` 分布不匹配源之后，修剪后实现了 124–191% 的保留率（Step-11 V8 重训练）。加密边界本身并未引入额外的精度下降。该方法论的贡献独立于任何单一的评估门结果而持续存在；v2 触发条件将转变为沿着正交轴（密码套件变体、mTLS、额外链）的 V9 或更后期的周期。 ## 仓库布局 - `paper.md` - 工作预印本，权威来源。更新将发布在此处。 - `bibliography.bib` - 参考文献。 - `scripts/check_consistency.py` - 自动一致性检查器（见下文）。 - `hooks/pre-commit` - 运行检查器的 git pre-commit 钩子（激活方法见下文）。 - `LICENSE-TEXT.md` - CC-BY-4.0（论文文本 + 图表 + 表格）。 - `LICENSE-CODE.md` - MIT（任何脚本 / 构建工具）。 ## 一致性检查手动运行一致性检查器： ``` python3 scripts/check_consistency.py ``` 或者将其作为 pre-commit 钩子接入您的本地克隆中（一次性设置）： ``` git config core.hooksPath hooks ``` 此后，每次 `git commit` 都会先运行检查器；任何 FAIL 发现都将阻止提交。在刻意的 WIP（进行中的工作）提交时，可通过 `git commit --no-verify` 绕过。它编码了在人工审查周期中暴露的常见不一致模式 - 破折号（论文约定为连字符）、自引用（`the substrate paper` → `this paper`）、过时状态短语（`Joint Outcome`、`in flight`）、禁止的绝对路径、 MC-N 覆盖率（定义 ↔ 引用）、D-NNN 覆盖率（正文 ↔ 附录 B 表格）、附录 B 标题范围、参考文献引用/定义交叉检查、计数短语一致性（例如， "eleven contributions" 与实际的 MC 计数匹配）、§5.1.1 原则计数、§8.6 升级事件计数、互斥状态声明（例如，`nr-bundle-spec` "private until X" 与 "published Y"），以及 § 交叉引用解析。如果所有检查均通过，退出码为 0；如果出现任何 FAIL 则为 1；使用错误则为 2。仅使用标准库；无外部依赖。 ## 配套工件 - **`nr-bundle-spec` v0.1.0** - Bundle v1 的开放格式规范（`github.com/NullRabbitLabs/nr-bundle-spec`， MIT 许可；在 2026-06-05 之前为私有仓库，待 Sui F10/F14 + Solana F10 的协调披露窗口关闭后公开）。包含 JSON Schema + Python 和 Rust 参考解析器 + 5 个示例包 + 用于模式重新生成和跨语言一致性的 CI。 - **`nr-bundles-public`**（即将推出，HuggingFace） - 精选的跨越多个基元和链的 20–50 个样本包。 ## 姊妹篇 [**Earned Autonomy**](https://doi.org/10.5281/zenodo.18406828) (Zenodo DOI `10.5281/zenodo.18406828`) - 面向生产部署的架构层姊妹篇。本文则是数据层姊妹篇；可独立阅读，在关键支撑处进行交叉引用。 ## 引用正式的 arXiv 预印本标识符将在 v1 发布时推出。在此之前，请按以下方式引用本工作草案： ``` @misc{morley2026leaksurfacepeeling, author = {Morley, Simon}, title = {Iterative leak-surface peeling: a falsifiability-anchored methodology for {ML} detection of blockchain validator infrastructure attacks}, year = {2026}, note = {Working draft, 2026-05-06. \url{https://github.com/NullRabbitLabs/nr-substrate-paper}} } ``` ## 许可证双重许可： - **论文文本 + 图表 + 表格**：CC-BY-4.0 ([`LICENSE-TEXT.md`](LICENSE-TEXT.md))。 - **代码、脚本、构建工具**：MIT ([`LICENSE-CODE.md`](LICENSE-CODE.md))。

标签：Apex, Aptos, Cosmos, DoS检测, ROC-AUC, Solana, Sui, TruffleHog, 以太坊, 区块链安全, 可视化界面, 基础设施攻击, 学术论文, 安全防护, 密码学, 异常检测, 手动系统调用, 拒绝服务攻击, 机器学习, 模型验证, 波普尔可证伪性, 特征工程, 网络安全, 网络安全研究, 网络流量分析, 论文草稿, 跨链安全, 过拟合, 迭代剥离, 逆向工具, 防御加固, 隐私保护, 预印本, 验证者节点