TushaeBXN/kerrigan-fantasma-overview

GitHub: TushaeBXN/kerrigan-fantasma-overview

基于定制循环深度 Transformer 架构的自主安全研究系统，通过自动 fuzzing 循环、exploit harness 生成与崩溃分析实现底层漏洞发现。

Stars: 1 | Forks: 0

# Kerrigan-Fantasma 📝 **博客文章：** [在 2013 款 MacBook 上构建用于安全研究的循环深度 Transformer](https://medium.com/@brian.thomas.t/building-a-recurrent-depth-transformer-for-security-research-on-a-2013-macbook-1b534101df31) — 完整文章发布于 Medium。 ## ⚠️ 负责任披露声明本仓库仅作为**公开概述**。核心实现、训练 pipeline、模型权重、fuzzing harness 和 exploit 逻辑均维护在一个私有仓库中。分享此项目是为了进行研究讨论和专业交流。不鼓励在授权的沙箱研究环境之外使用此处描述的任何技术。 ## 概念验证自主 fuzzing 循环目前可正常运行。以下是在 HTTP 请求解析器目标上进行 4 次会话的真实结果： | 指标 | 结果 | |--------|--------| | 运行会话数 | 4 | | 生成输入总数 | 380 | | 唯一崩溃签名 | 2 | | 崩溃类型 | SIGILL (CWE-121 栈溢出), SIGABRT (CWE-122 堆溢出) | | CVE 类比 | Heartbleed (OOB 读取模式), Kaminsky (边界条件) | 这些结果是在一台没有 GPU 的 2013 款 MacBook Pro 上发现的 —— C 变异引擎通过编译的原生引擎以每秒 295 万次变异的速度运行，且编译缓存将重复的 harness 构建耗时降至 0ms。 ## 什么是 Kerrigan-Fantasma？ Kerrigan-Fantasma 是一个围绕定制的**循环深度 Transformer (RDT)** 架构构建的 AI 安全研究系统 —— 从第一性原理出发，专为底层漏洞研究而设计。它作为一个自主循环运行：在给定目标攻击面后，它会对攻击空间进行推理，生成 C exploit harness，在隔离环境中执行它们，分析崩溃，并不断完善其假设。这并不是将一个微调的通用 LLM 应用于安全领域。其架构、tokenizer 和训练语料库都是专门针对该领域的特殊需求而设计的。 ## 架构概述 ``` ┌─────────────────────────────────────────────────────┐ │ Kerrigan-Fantasma │ │ Recurrent-Depth Transformer │ ├─────────────────────────────────────────────────────┤ │ Input Layer │ Multi-domain tokenizer │ │ │ C / ASM / UEFI / CVE-aware vocab │ ├─────────────────┼─────────────────────────────────────┤ │ Core Model │ Custom RDT architecture │ │ │ Recurrent depth blocks │ │ │ Multi-scale attention │ ├─────────────────┼─────────────────────────────────────┤ │ Reasoning │ Exploit hypothesis engine │ │ Layer │ Attack surface decomposition │ │ │ Crash signature analysis │ ├─────────────────┼─────────────────────────────────────┤ │ Execution │ Autonomous harness generation │ │ Layer │ 7-layer code validation pipeline │ │ │ Docker-isolated sandbox │ ├─────────────────┼─────────────────────────────────────┤ │ Feedback │ Crash → learning loop │ │ Loop │ CVE pattern reinforcement │ └─────────────────────────────────────────────────────┘ ``` ## 核心能力 ### 自主 Fuzzing 循环系统会编写自己的 C exploit harness 来针对提供的攻击面，在隔离的沙箱内执行它们，捕获并分类崩溃，然后将结果反馈到推理层。在迭代周期之间无需人工干预。C 变异引擎每秒可生成 295 万次变异；可以将 AFL++ 接入作为真实二进制文件的覆盖率引导后端。 ### 底层领域覆盖训练数据包括： - Linux 内核源码（syscall 接口、内存子系统、调度器） - UEFI/EDK2 固件源码（DXE 核心、SMM 核心、SecurityPkg） - CPU 架构文档（x86_64、ARM64、RISC-V ISA） - NVD CVE 语料库（涵盖内存损坏、硬件、固件的 500 多个条目） - Project Zero 研究成果和 arxiv cs.CR 论文 - 12 种编程和汇编语言（C、C++、Rust、汇编、Python、Go、JS、Java、Verilog、VHDL、SystemVerilog、Bash） ### 纵深防御沙箱在任何生成的 harness 执行之前，它都会通过一个 7 层验证 pipeline： 1. 静态语法验证 2. 危险 syscall 检测 3. 资源上限强制执行（内存、CPU 时间、文件描述符） 4. 网络隔离断言 5. 文件系统范围限制 6. Docker 容器隔离 7. 执行后 artifact 审查 ### Exploit Harness 生成给定一个目标（内核模块、固件镜像、二进制文件），模型会分解攻击面，选择候选漏洞类别（缓冲区溢出、释放后重用、竞态条件、类型混淆等），并为每个假设生成针对性的 C harness。 ### OSINT 套件 9 个集成模块：email 情报、domain 情报、社交媒体、电话、网站指纹识别、EXIF 提取、图像搜索、暗网查询和全目标聚合。所有输出均通过 Overmind 安全验证器进行门控，并记录到持久化内存中。 ### 持久化内存 ChromaDB 向量存储可跨会话保留调查结果。每次崩溃、OSINT 结果和推理链都会被存储起来，供未来运行检索 —— 系统使用得越多，其效率就越高。 ## 训练状态 | 阶段 | 重点 | 状态 | |-------|-------|--------| | 冒烟测试 (100 步) | 架构验证 | ✅ 完成 — loss 4.62 → 2.14 | | 概念验证 (1,000 步) | 安全语料库、loss 验证 | ✅ 完成 | | SFT (50,000 步) | 代码 + 硬件 + 安全合并语料库 | 🔲 等待 GPU (RunPod) | | 硬件 (20,000 步) | 内核 + 固件 + CPU 规格微调 | 🔲 等待 GPU | | 指令 (10,000 步) | 问答对：Spectre、ROP、UEFI、TrustZone | 🔲 等待 GPU | 当前推理骨干：**Ollama + deepseek-coder:6.7b**。fuzzer、编译器缓存、变异引擎和安全系统目前在骨干下已完全可用。原生 KerriganCore 模型已可运行，并需要 GPU 时间来替代它。 ## 设计原则 **非简单封装。** 每个组件 —— 架构、tokenizer、训练 pipeline 和执行 harness —— 都是为此领域而构建的。不存在作为提示词底层的商业模型。 **隔离优先。** 系统的设计基于“生成的代码具有潜在危险性”这一假设。执行操作绝不会在定义的沙箱边界之外进行。 **失败即信号。** 崩溃不是需要被抑制的错误 —— 它们是数据点。反馈循环是提升能力的核心机制。 **具备范围感知。** 系统会跟踪在每个目标攻击面中已探索过哪些漏洞类别，并明确避免生成冗余的假设。 ## 威胁模型与预期用途 Kerrigan-Fantasma 专为以下场景设计： - 授权的渗透测试环境 - 对您拥有或获得明确书面测试许可的系统进行安全研究 - 学术和防御性安全研究 - 在批准的项目内开发红队工具它**不**适用于以下情况，且作者不认可将其用于： - 未经授权的系统访问 - 超出合法授权范围外的攻击性操作 - 任何违反适用计算机欺诈和滥用法案的活动 ## 技术栈快照 | 组件 | 详情 | |-----------|--------| | 模型架构 | 定制循环深度 Transformer (RDT) | | 框架 | PyTorch 2.2.2 | | Harness 语言 | C (主要), Python (编排) | | 变异引擎 | 通过 ctypes 的原生 C — 295 万次变异/秒 | | 编译缓存 | SHA-256 内容哈希，命中时为 0ms | | 执行环境 | Docker (多层隔离) | | 内存后端 | ChromaDB + MySQL (KerriganDB) | | CI | GitHub Actions | | 主要领域 | Linux kernel, UEFI, x86_64 / ARM64 / RISC-V, CVE 语料库 | ## 状态活跃的研究项目。自主 fuzzing 循环、变异引擎、编译缓存、OSINT 套件和安全验证器均功能正常。原生 KerriganCore 架构已构建并完成冒烟训练 —— 完整训练正等待 RunPod 上的 GPU 时间。该系统目前在隔离的实验室基础设施上运行，未进行外部部署。 ## 研究员 **Brian Thomas (TushaeBXN)** 云安全工程师 · AI 系统构建者 · 美国北卡罗来纳州夏洛特市 [GitHub](https://github.com/TushaeBXN) · [LinkedIn](https://www.linkedin.com/in/brian-t-24748719/) · [ORCID](https://orcid.org/0009-0002-9633-3469) *核心实现维护在一个私有仓库中。此概述仅用于专业交流和研究讨论。*

标签：AI风险缓解, DLL 劫持, Go语言工具, 人工智能, 凭据扫描, 大语言模型, 崩溃分析, 情报收集, 漏洞研究, 用户模式Hook绕过, 自动化漏洞挖掘, 误配置预防, 请求拦截, 逆向工具