NullRabbitLabs/nr-substrate-paper
GitHub: NullRabbitLabs/nr-substrate-paper
该论文提出迭代泄漏面剥离方法论,通过预注册阈值与多层可证伪性鉴别器,系统性暴露并修正ML检测区块链验证器DoS攻击中的伪高指标问题。
Stars: 0 | Forks: 0
# 迭代泄漏面剥离
*一种以可证伪性为锚定的方法论,用于 ML 检测
区块链验证器基础设施攻击。*
**作者**:Simon Morley, NullRabbit
**状态**:工作草案 (2026-05-06)。更新将直接发布在
`paper.md` 中;当 arXiv 提交发布时,将推出 v1 预印本。
## 摘要
公网可达的区块链验证器基础设施是
不对称资源消耗攻击的诱人目标;
通过 2024–2026 年的
协调披露管道,涉及 Sui、Solana、
Ethereum、Aptos 和 Cosmos 系链的验证器 DoS 发现已稳步积累。对于在此威胁面上
建立监控的运营商而言,能够经受住明文 / TLS 前端边界、跨链传输以及
实验室 / 主网保真度层级考验的检测是不可或缺的。然而,基于 ML 的
此类攻击检测在发布时,通常在
交叉验证折叠中表现出等于或接近 1.000 的中位 ROC-AUC,但在审计时证明这属于伪像,而非
反映了底层的网络行为
[sommer2010outside, arp2022dosdonts]。我们的 V1 训练器针对初始 1,092 包 Sui 验证器 DoS 语料库的
首份 TrainReport 是该模式下的一个新数据点:在所有 17 个
留一基元出折叠中 ROC = 1.000,这是由随机高斯特征的
ROC = 1.000(LOPO 良性保留集污染)和 `resp.count` 的
ROC = 1.000(捕获管道共线性)所驱动的。
本文提出了**迭代泄漏面剥离**:这是一种在最终数据出炉之前预注册
数值阈值、结构预测和
结果带组合规则的方法论,随后通过多层可证伪性鉴别器和审计驱动的迭代来暴露并
修正其自身的失效模式。在
针对 2,103 包 Sui+Solana 语料库的 V1 → V7-narrow 过程中,该方法论
按顺序暴露并消除了八个独立的泄漏面。
两大开放支柱支撑了该方法论:**Bundle v1**,一种
具有受控词汇来源字段的
多模态捕获格式,通过三项已落地的模式累加扩展进行了演示;
以及一个包含十种攻击家族外加良性的**链无关家族分类法**,能够在不进行扩展的情况下对循环后攻击进行分类。
技术核心是 V7-narrow 多机制发现:
该领域中跨链机制的不可转移性是
**特征局部化的,而非针对整个特征空间**。在
V7-narrow 评估门处的头条结果是联合 C(在
速率不变的 13 特征清单层级的跨链机制声明,在
实验室保真度下被证伪)。随后的 Step-11 V1 + V8 重训练周期在
密码无关声明上交付了联合 A:在两种 LOPO 体制下的两条链上,
相对于预注册的 Step-11 V1 明文基线实现了 100% 的保留率
(Step-11 V1 重训练),并且在移除了受 V7-narrow §SE3 影响的
`pcap.mean_packet_size` 分布不匹配源之后,
修剪后实现了 124–191% 的保留率(Step-11 V8 重训练)。加密边界本身并未引入
额外的精度下降。该方法论的贡献
独立于任何单一的评估门结果而持续存在;v2
触发条件将转变为沿着正交轴
(密码套件变体、mTLS、额外链)的 V9 或更后期的周期。
## 仓库布局
- `paper.md` - 工作预印本,权威来源。更新将发布在
此处。
- `bibliography.bib` - 参考文献。
- `scripts/check_consistency.py` - 自动一致性检查器
(见下文)。
- `hooks/pre-commit` - 运行检查器的 git pre-commit 钩子
(激活方法见下文)。
- `LICENSE-TEXT.md` - CC-BY-4.0(论文文本 + 图表 + 表格)。
- `LICENSE-CODE.md` - MIT(任何脚本 / 构建工具)。
## 一致性检查
手动运行一致性检查器:
```
python3 scripts/check_consistency.py
```
或者将其作为 pre-commit 钩子接入您的本地克隆中(一次性
设置):
```
git config core.hooksPath hooks
```
此后,每次 `git commit` 都会先运行检查器;任何 FAIL
发现都将阻止提交。在刻意的 WIP(进行中的工作)提交时,
可通过 `git commit --no-verify` 绕过。
它编码了在人工审查周期中暴露的常见不一致模式 - 破折号(论文约定为连字符)、自引用
(`the substrate paper` → `this paper`)、过时状态
短语(`Joint Outcome`、`in flight`)、禁止的绝对路径、
MC-N 覆盖率(定义 ↔ 引用)、D-NNN 覆盖率(正文
↔ 附录 B 表格)、附录 B 标题范围、参考文献
引用/定义交叉检查、计数短语一致性(例如,
"eleven contributions" 与实际的 MC 计数匹配)、§5.1.1
原则计数、§8.6 升级事件计数、互斥
状态声明(例如,`nr-bundle-spec` "private until X" 与
"published Y"),以及 § 交叉引用解析。
如果所有检查均通过,退出码为 0;如果出现任何 FAIL 则为 1;
使用错误则为 2。
仅使用标准库;无外部依赖。
## 配套工件
- **`nr-bundle-spec` v0.1.0** - Bundle v1 的开放格式规范
(`github.com/NullRabbitLabs/nr-bundle-spec`,
MIT 许可;在 2026-06-05 之前为私有仓库,待
Sui F10/F14 + Solana F10 的
协调披露窗口关闭后公开)。包含 JSON Schema + Python 和 Rust 参考解析器 + 5 个
示例包 + 用于模式重新生成和跨语言
一致性的 CI。
- **`nr-bundles-public`**(即将推出,HuggingFace) - 精选的
跨越多个基元和链的 20–50 个样本包。
## 姊妹篇
[**Earned Autonomy**](https://doi.org/10.5281/zenodo.18406828)
(Zenodo DOI `10.5281/zenodo.18406828`) - 面向
生产部署的架构层姊妹篇。本文则是数据层姊妹篇;
可独立阅读,在关键支撑处进行交叉引用。
## 引用
正式的 arXiv 预印本标识符将在 v1 发布时推出。在此之前,请
按以下方式引用本工作草案:
```
@misc{morley2026leaksurfacepeeling,
author = {Morley, Simon},
title = {Iterative leak-surface peeling: a falsifiability-anchored
methodology for {ML} detection of blockchain validator
infrastructure attacks},
year = {2026},
note = {Working draft, 2026-05-06.
\url{https://github.com/NullRabbitLabs/nr-substrate-paper}}
}
```
## 许可证
双重许可:
- **论文文本 + 图表 + 表格**:CC-BY-4.0
([`LICENSE-TEXT.md`](LICENSE-TEXT.md))。
- **代码、脚本、构建工具**:MIT
([`LICENSE-CODE.md`](LICENSE-CODE.md))。
标签:Apex, Aptos, Cosmos, DoS检测, ROC-AUC, Solana, Sui, TruffleHog, 以太坊, 区块链安全, 可视化界面, 基础设施攻击, 学术论文, 安全防护, 密码学, 异常检测, 手动系统调用, 拒绝服务攻击, 机器学习, 模型验证, 波普尔可证伪性, 特征工程, 网络安全, 网络安全研究, 网络流量分析, 论文草稿, 跨链安全, 过拟合, 迭代剥离, 逆向工具, 防御加固, 隐私保护, 预印本, 验证者节点