FirstEverTech/RTX4000-MFG-Unlock

GitHub: FirstEverTech/RTX4000-MFG-Unlock

本仓库记录了在RTX 4000系列上研究DLSS 4多帧生成3x/4x的科研过程，旨在揭示其性能与呈现行为边界。

Stars: 8 | Forks: 0

# NVIDIA GeForce RTX 4000 系列 — DLSS 4 多帧生成 3x/4x 研究最近我一直在研究各种项目 — 其中一些人可能知道我的工作： - **[通用英特尔芯片组设备更新器](https://github.com/FirstEverTech/Universal-Intel-Chipset-Updater)** - **[通用英特尔 Wi‑Fi 和蓝牙驱动更新器](https://github.com/FirstEverTech/Universal-Intel-WiFi-BT-Updater)** 这一次，我开始对一件困扰我一段时间的事情感兴趣： ## **在 RTX 4000 系列显卡上实现 DLSS 4 多帧生成 3x/4x**

## 为何这个项目存在很难不注意到 NVIDIA 越来越多地利用软件功能作为不同代产品之间的差异化卖点。与此同时： - GPU 价格在上涨 - 原生代际性能提升往往有限 - 软件锁定功能在产品细分中变得越来越重要对于 RTX 5000 来说，一个最明显的例子是 **更高阶的帧生成（3x/4x）**。这引发了一个非常自然的技术问题： ## 本仓库的目的本仓库记录了我对 **GeForce RTX 4000 系列** GPU 上强制 **DLSS 4 多帧生成 3x/4x** 行为的研究。该项目目前聚焦于三个方面： 1. 记录观察到的运行时行为 2. 使用 **NVIDIA Nsight Systems 2026.2.1** 验证帧呈现行为 3. 调查驱动层黑屏强制执行的路径这 **不是** 一个现成的解锁包。它是一个公开的科研日志。 ## 当前状态（一句话总结）目前，我的结论是：这一结论基于： - 可重复的基准测试行为 - 公开的 3DMark 跑分 - 本地《赛博朋克 2077》测试 - 对帧呈现的直接 Nsight 分析 ## 基本激活路径在 RTX 4000 上激活 FG 3x/4x 并不特别困难，从前端即可操作。 **[NVIDIA Profile Inspector](https://github.com/Orbmu2k/nvidiaProfileInspector)** 可用于全局设置帧生成倍率，绕开 NVIDIA App 的锁定。

该设置随后会在 NVIDIA App 中显示（只读）。

## 重要更新 — 我最初的 `ShowEvalModeOverlay` 理论是错误的我使用 [**Ghidra**](https://github.com/NationalSecurityAgency/ghidra)（由美国国家安全局开发）对 `nvlddmkm.sys` 进行了静态分析。 Ghidra

早期版本的本仓库曾暗示，`nvlddmkm.sys` 中的 `ShowEvalModeOverlay` 字符串可能直接导致在 **RTX 4000 系列** 上启用 **MFG 3x/4x** 后出现全屏黑输出。经过进一步研究，我可以明确指出：测试的字节级控制流修改 **并未** 禁用黑图像/黑屏行为。它实际禁用的是 **NVIDIA App 覆盖菜单** 功能 — 也就是用于以下功能的游戏内覆盖层： - 录制 - 截图 - 性能统计 - 及相关覆盖 UI 因此 `ShowEvalModeOverlay` 被证明是一条 **错误线索**。然而，这仍然是有价值的研究，因为它揭示了： - 精确的低级修改可以改变驱动行为 **而不破坏驱动本身** - 精心定位的侵入式补丁 **不一定** 会损坏或使修改后的 NVIDIA 内核驱动不稳定 - 在此研究过程中，我也确认了即使启用 **Secure Boot**，也可以安装 **新修改的内核驱动**（细节此处未披露）

因此，尽管该分支 **不是** 黑屏开关，但这项工作仍然发现了关于驱动健壮性和补丁行为的重要信息。 ## 主要问题 — 黑图像 / 黑输出强制执行在启用 **RTX 4000 系列上的帧生成 3x/4x** 后，会一致出现意外行为： ### 观察到的行为 - NVIDIA App 报告预期的 FPS 缩放 - 游戏仍可交互 - 帧时序保持一致 - 音频正常 - 基准测试正确检测到生成的帧这强烈表明渲染路径 **并非简单崩溃**。相反，输出似乎是 **被故意遮蔽** 的。 ## 推动本研究的外部参考推动我继续深入的主要外部参考是这段中文媒体视频： - **NVIDIA GeForce RTX 4080 笔记本 / Arch Linux / MFG 4x 在《赛博朋克 2077》中**：[Bilibili 视频](https://www.bilibili.com/video/BV1nVAWeAEg1) - **NVIDIA GeForce RTX 4080 笔记本 / Windows / MFG 4x 在《赛博朋克 2077》中**：[Bilibili 视频](https://www.bilibili.com/video/BV1WZfZYxEtQ) 本仓库仅将这些视频作为 **外部背景 / 动机** 使用，并非核心证明。我自己的观察表明，其中展示的内容是真实的，并且与本地结果方向一致。不过，这里收集的最强证据仍来自本地测试和 Nsight 分析。 ## 基准测试证据 ### 3DMark NVIDIA DLSS 特性测试 | DLSS FG 模式 | DLSS 关闭 | DLSS 开启 | 倍率 | |---------------------|----------|---------|------------| | 帧生成 2x | 32.27 FPS | 125.16 FPS | 3.9x | | 帧生成 3x | 32.16 FPS | 224.02 FPS | 7.0x | | 帧生成 4x | 32.20 FPS | 291.56 FPS | 9.1x | | [DLSS 4 帧生成 2x](https://www.3dmark.com/nd/580395) | [DLSS 4 帧生成 3x](https://www.3dmark.com/nd/580396) | [DLSS 4 帧生成 4x](https://www.3dmark.com/nd/580397) | |:---------------:|:--------------:|:-------------------:| | ![DLSS 4 帧生成 2x](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/84644de429040942.png) | ![DLSS 4 帧生成 3x](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/a7a8459d41040944.png) | ![DLSS 4 帧生成 4x](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/dc052f04d7040947.png) | **已验证的官方 3DMark 结果：** https://www.3dmark.com/compare/nd/580395/nd/580396/nd/580397 3DMark_2x_3x_4x

### 《赛博朋克 2077》内置基准 — 光线追踪：超高，4K | 模式 | 平均 FPS | 最低 FPS | 最高 FPS | |------|--------:|--------:|--------:| | FG 2x | 75.83 | 69.78 | 82.18 | | FG 3x | 124.49 | 113.24 | 136.96 | | FG 4x | 164.68 | 149.75 | 180.54 | | DLSS 4 帧生成 2x | DLSS 4 帧生成 3x | DLSS 4 帧生成 4x | |:---:|:---:|:---:| | ![DLSS 4 帧生成 2x](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/9c5909bcd1040950.png) | ![DLSS 4 帧生成 3x](https://github.com/user-attachments/assets/ff6b3315-f1cb-46a3-84eb-6af3f353d0d) | ![DLSS 4 帧生成 4x](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/23c46cf499040954.png) | 这些结果本身 **不能** 证明画质完美。但它们确实表明： - 性能提升是可重复的 - 缩放在内部是一致的 - 帧生成路径已经足够活跃，能够被外部工具测量

完整的 3DMark 结果文件（`.3dmark-result`）可在 [**发布页面**](https://github.com/FirstEverTech/RTX4000-MFG-Unlock/releases) 下载。下载后可在本地用 3DMark 打开，检查帧时间图表并自行验证结果。 ## 为何我转向使用 Nsight Systems 一旦 `ShowEvalModeOverlay` 理论不再成立，最合理的选择是停止猜测驱动中的某个分支含义，而是直接检查帧流水线。因此，我在匹配条件下捕获了三份 Nsight Systems 跟踪： - `CP2077-fg2x.nsys-rep` - `CP2077-fg3x.nsys-rep` - `CP2077-fg4x.nsys-rep` ### 捕获设置 - **应用**：赛博朋克 2077 - **模式**：内置基准 - **预设**：光线追踪：超高 - **分辨率**：4K - **工具**：NVIDIA Nsight Systems 2026.2.1 - **捕获时长**：10 秒 - **目标**：在相同可重复场景路径下比较 FG 2x 与 FG 3x 与 FG 4x 的实际呈现行为

## Nsight 分析所展示的内容一份完整的独立 Nsight 分析报告计划作为 **发布资产** 提供： - `RTX4000_MFG_Nsight_Technical_Note.md` 该文件旨在配合原始捕获文件使用： - `CP2077-fg2x.nsys-rep` - `CP2077-fg3x.nsys-rep` - `CP2077-fg4x.nsys-rep` ### 发现的简要总结 Nsight 中的主要模式非常清晰： - **FG 2x** 在 **2 个呈现/基础周期** 内分组 - **FG 3x** 在 **3 个呈现/基础周期** 内分组 - **FG 4x** 在 **4 个呈现/基础周期** 内分组在稳定的分析窗口中，估算的基础渲染速率保持在相似范围，而呈现数量随所选模式按比例扩展： | 模式 | 呈现 FPS | 估算基础渲染周期/s | 主要数据包大小 | |------|------------:|-------------------------------:|---------------------:| | FG 2x | 72.25 | 36.20 | 2 | | FG 3x | 111.60 | 37.20 | 3 | | FG 4x | 153.80 | 38.45 | 4 | 这很重要，因为它 **看起来不像简单的假 FPS 计数器提升**。看起来像是一个实际输出额外呈现的管线，其数据包结构与所选倍率一致。 | 单个基准段中的呈现事件 | 输出呈现速率与估算基础渲染周期对比 | |:---------------:|:--------------: | ![figure_1_present_excerpt](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/99a08a5ded040956.png) | ![figure_2_delta_histogram](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/7b4a190e72040958.png) | | 基于 >12 毫秒间隔的数据包大小推断 | 20–40 秒分析窗口内的呈现间隔分布 | | ![figure_3_rates](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/1fe0e535f7041001.png) | ![figure_4_packet_sizes](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/c2d8fe4781041003.png) | ## 我目前根据数据支持的结论基于基准测试数据和 Nsight 捕获，我的当前结论是：这个结论比单纯说： - “FPS 计数器上升了” - “3DMark 报告了更大的数值” - “它只是重播完全相同的已完成帧” 要更有力得多。同时，我也希望保持精确和谨慎： ## 目前尚未证明的内容当前数据 **尚未** 完全证明： - 图像质量与原生 RTX 5000 系列 MFG 完全一致 - 运动质量在所有边缘情况下都一致 - 延迟行为一致 - 每个生成的帧在感知上都同样优秀 - 所有驱动层强制逻辑都已被理解因此，诚实的结论 **不是**：诚实的结论是： ## 发布结构本项目的预期 **发布** 包包含： - 原始 Nsight 捕获文件： - `CP2077-fg2x.nsys-rep` - `CP2077-fg3x.nsys-rep` - `CP2077-fg4x.nsys-rep` - 独立的补充分析： - `RTX4000_MFG_Nsight_Technical_Note.md` - `RTX4000_MFG_Nsight_Technical_Note.pdf` - 可选的分析图表导出 - 可选的基准工件，例如 `.3dmark-result` 文件这样人们可以： 1. 阅读 README 中的简要版本 2. 检查更深入的技术说明 3. 并独立验证原始捕获材料 **发布页面：** https://github.com/FirstEverTech/RTX4000-MFG-Unlock/releases ## 当前工作目前的主要研究方向是：这项工作缓慢且耗时。每一次错误引导都可能耗费数小时。但 Nsight 的发现正是该项目值得继续推进的原因：它们表明黑屏之下可能发生了有意义的事情。 ## 如果你想提供帮助有用的贡献包括： 1. 对分析的同行评审 2. 在其他 RTX 4000 显卡上的额外测试 3. 来自其他游戏/场景的 Nsight 捕获 4. 强制 RTX 4000 MFG 与原生 RTX 5000 MFG 的图像质量对比 5. 驱动行为的独立技术讨论如果你复现了类似结果，请随时通过以下方式打开问题或讨论： - GPU 型号 - 驱动版本 - 游戏/场景 - 测试方法 - 捕获文件 - 观察到的黑输出行为 ## 支持本项目该项目在我的业余时间开发，当前阶段的工作 **极其耗时**。如果你发现这项研究有用并希望支持进一步的黑屏强制路径研究，欢迎捐赠。 [![PayPal](https://img.shields.io/badge/PayPal-Support_Development-00457C?style=for-the-badge&logo=paypal)](https://www.paypal.com/donate/?hosted_button_id=48VGDSCNJAPTJ)[![Buy Me a Coffee](https://img.shields.io/badge/Buy_Me_a_Coffee-Support_Work-FFDD00?style=for-the-badge&logo=buymeacoffee)](https://buymeacoffee.com/firstevertech)[![GitHub Sponsors](https://img.shields.io/badge/GitHub-Sponsor-EA4AAA?style=for-the-badge&logo=githubsponsors)](https://github.com/sponsors/FirstEverTech) 每一份贡献都帮助覆盖了更多时间花费在： - 逆向工程 - 控制测试 - Nsight 分析 - 结果文档 - 发布原始材料供独立审查 ## 免责声明 / 法律声明本仓库严格仅用于： - 研究 - 教育 - 文档 - 技术讨论它 **不** 分发修改后的 NVIDIA 驱动或二进制文件。它 **不** 提供现成的绕过包。它 **不** 披露用于安装修改内核驱动的方法。它 **不** 鼓励用户削弱平台安全性或违反软件许可协议。所有商标、产品名称和技术均其各自所有者所有。请负责任地、遵守适用法律、许可协议和平台政策使用这些信息。 ## 作者与联系方式 **Marcin Grygiel**（又名 **FirstEver**） - 🌐 网站：https://www.firstever.tech - 💼 LinkedIn：https://www.linkedin.com/in/marcin-grygiel/ - 🔧 GitHub：https://github.com/FirstEverTech - 📧 联系：https://www.firstever.tech/contact

标签：3x, 4x, AI 加速, benchmark, DLSS, GeForce, GPU, Multi Frame Generation, Nsight Systems, RTX 4000, UML, 帧呈现, 帧生成, 性能测试, 显卡, 显卡升级, 显卡性能分析, 显卡超频, 深度学习, 游戏优化, 超分辨率, 软件特征解锁, 逆向工具, 驱动, 驱动级限制, 黑屏检测