NullRabbitLabs/nr-substrate-paper

GitHub: NullRabbitLabs/nr-substrate-paper

该论文提出迭代泄漏面剥离方法论,通过预注册阈值与多层可证伪性鉴别器,系统性暴露并修正ML检测区块链验证器DoS攻击中的伪高指标问题。

Stars: 0 | Forks: 0

# 迭代泄漏面剥离 *一种以可证伪性为锚定的方法论,用于 ML 检测 区块链验证器基础设施攻击。* **作者**:Simon Morley, NullRabbit **状态**:工作草案 (2026-05-06)。更新将直接发布在 `paper.md` 中;当 arXiv 提交发布时,将推出 v1 预印本。 ## 摘要 公网可达的区块链验证器基础设施是 不对称资源消耗攻击的诱人目标; 通过 2024–2026 年的 协调披露管道,涉及 Sui、Solana、 Ethereum、Aptos 和 Cosmos 系链的验证器 DoS 发现已稳步积累。对于在此威胁面上 建立监控的运营商而言,能够经受住明文 / TLS 前端边界、跨链传输以及 实验室 / 主网保真度层级考验的检测是不可或缺的。然而,基于 ML 的 此类攻击检测在发布时,通常在 交叉验证折叠中表现出等于或接近 1.000 的中位 ROC-AUC,但在审计时证明这属于伪像,而非 反映了底层的网络行为 [sommer2010outside, arp2022dosdonts]。我们的 V1 训练器针对初始 1,092 包 Sui 验证器 DoS 语料库的 首份 TrainReport 是该模式下的一个新数据点:在所有 17 个 留一基元出折叠中 ROC = 1.000,这是由随机高斯特征的 ROC = 1.000(LOPO 良性保留集污染)和 `resp.count` 的 ROC = 1.000(捕获管道共线性)所驱动的。 本文提出了**迭代泄漏面剥离**:这是一种在最终数据出炉之前预注册 数值阈值、结构预测和 结果带组合规则的方法论,随后通过多层可证伪性鉴别器和审计驱动的迭代来暴露并 修正其自身的失效模式。在 针对 2,103 包 Sui+Solana 语料库的 V1 → V7-narrow 过程中,该方法论 按顺序暴露并消除了八个独立的泄漏面。 两大开放支柱支撑了该方法论:**Bundle v1**,一种 具有受控词汇来源字段的 多模态捕获格式,通过三项已落地的模式累加扩展进行了演示; 以及一个包含十种攻击家族外加良性的**链无关家族分类法**,能够在不进行扩展的情况下对循环后攻击进行分类。 技术核心是 V7-narrow 多机制发现: 该领域中跨链机制的不可转移性是 **特征局部化的,而非针对整个特征空间**。在 V7-narrow 评估门处的头条结果是联合 C(在 速率不变的 13 特征清单层级的跨链机制声明,在 实验室保真度下被证伪)。随后的 Step-11 V1 + V8 重训练周期在 密码无关声明上交付了联合 A:在两种 LOPO 体制下的两条链上, 相对于预注册的 Step-11 V1 明文基线实现了 100% 的保留率 (Step-11 V1 重训练),并且在移除了受 V7-narrow §SE3 影响的 `pcap.mean_packet_size` 分布不匹配源之后, 修剪后实现了 124–191% 的保留率(Step-11 V8 重训练)。加密边界本身并未引入 额外的精度下降。该方法论的贡献 独立于任何单一的评估门结果而持续存在;v2 触发条件将转变为沿着正交轴 (密码套件变体、mTLS、额外链)的 V9 或更后期的周期。 ## 仓库布局 - `paper.md` - 工作预印本,权威来源。更新将发布在 此处。 - `bibliography.bib` - 参考文献。 - `scripts/check_consistency.py` - 自动一致性检查器 (见下文)。 - `hooks/pre-commit` - 运行检查器的 git pre-commit 钩子 (激活方法见下文)。 - `LICENSE-TEXT.md` - CC-BY-4.0(论文文本 + 图表 + 表格)。 - `LICENSE-CODE.md` - MIT(任何脚本 / 构建工具)。 ## 一致性检查 手动运行一致性检查器: ``` python3 scripts/check_consistency.py ``` 或者将其作为 pre-commit 钩子接入您的本地克隆中(一次性 设置): ``` git config core.hooksPath hooks ``` 此后,每次 `git commit` 都会先运行检查器;任何 FAIL 发现都将阻止提交。在刻意的 WIP(进行中的工作)提交时, 可通过 `git commit --no-verify` 绕过。 它编码了在人工审查周期中暴露的常见不一致模式 - 破折号(论文约定为连字符)、自引用 (`the substrate paper` → `this paper`)、过时状态 短语(`Joint Outcome`、`in flight`)、禁止的绝对路径、 MC-N 覆盖率(定义 ↔ 引用)、D-NNN 覆盖率(正文 ↔ 附录 B 表格)、附录 B 标题范围、参考文献 引用/定义交叉检查、计数短语一致性(例如, "eleven contributions" 与实际的 MC 计数匹配)、§5.1.1 原则计数、§8.6 升级事件计数、互斥 状态声明(例如,`nr-bundle-spec` "private until X" 与 "published Y"),以及 § 交叉引用解析。 如果所有检查均通过,退出码为 0;如果出现任何 FAIL 则为 1; 使用错误则为 2。 仅使用标准库;无外部依赖。 ## 配套工件 - **`nr-bundle-spec` v0.1.0** - Bundle v1 的开放格式规范 (`github.com/NullRabbitLabs/nr-bundle-spec`, MIT 许可;在 2026-06-05 之前为私有仓库,待 Sui F10/F14 + Solana F10 的 协调披露窗口关闭后公开)。包含 JSON Schema + Python 和 Rust 参考解析器 + 5 个 示例包 + 用于模式重新生成和跨语言 一致性的 CI。 - **`nr-bundles-public`**(即将推出,HuggingFace) - 精选的 跨越多个基元和链的 20–50 个样本包。 ## 姊妹篇 [**Earned Autonomy**](https://doi.org/10.5281/zenodo.18406828) (Zenodo DOI `10.5281/zenodo.18406828`) - 面向 生产部署的架构层姊妹篇。本文则是数据层姊妹篇; 可独立阅读,在关键支撑处进行交叉引用。 ## 引用 正式的 arXiv 预印本标识符将在 v1 发布时推出。在此之前,请 按以下方式引用本工作草案: ``` @misc{morley2026leaksurfacepeeling, author = {Morley, Simon}, title = {Iterative leak-surface peeling: a falsifiability-anchored methodology for {ML} detection of blockchain validator infrastructure attacks}, year = {2026}, note = {Working draft, 2026-05-06. \url{https://github.com/NullRabbitLabs/nr-substrate-paper}} } ``` ## 许可证 双重许可: - **论文文本 + 图表 + 表格**:CC-BY-4.0 ([`LICENSE-TEXT.md`](LICENSE-TEXT.md))。 - **代码、脚本、构建工具**:MIT ([`LICENSE-CODE.md`](LICENSE-CODE.md))。
标签:Apex, Aptos, Cosmos, DoS检测, ROC-AUC, Solana, Sui, TruffleHog, 以太坊, 区块链安全, 可视化界面, 基础设施攻击, 学术论文, 安全防护, 密码学, 异常检测, 手动系统调用, 拒绝服务攻击, 机器学习, 模型验证, 波普尔可证伪性, 特征工程, 网络安全, 网络安全研究, 网络流量分析, 论文草稿, 跨链安全, 过拟合, 迭代剥离, 逆向工具, 防御加固, 隐私保护, 预印本, 验证者节点