FirstEverTech/RTX4000-MFG-Unlock

GitHub: FirstEverTech/RTX4000-MFG-Unlock

本仓库记录了在RTX 4000系列上研究DLSS 4多帧生成3x/4x的科研过程,旨在揭示其性能与呈现行为边界。

Stars: 1 | Forks: 0

# NVIDIA GeForce RTX 4000 系列 — DLSS 4 多帧生成 3x/4x 研究 最近我一直在研究各种项目 — 其中一些人可能知道我的工作: - **[通用英特尔芯片组设备更新器](https://github.com/FirstEverTech/Universal-Intel-Chipset-Updater)** - **[通用英特尔 Wi‑Fi 和蓝牙驱动更新器](https://github.com/FirstEverTech/Universal-Intel-WiFi-BT-Updater)** 这一次,我开始对一件困扰我一段时间的事情感兴趣: ## **在 RTX 4000 系列显卡上实现 DLSS 4 多帧生成 3x/4x** image ## 为何这个项目存在 很难不注意到 NVIDIA 越来越多地利用软件功能作为不同代产品之间的差异化卖点。 与此同时: - GPU 价格在上涨 - 原生代际性能提升往往有限 - 软件锁定功能在产品细分中变得越来越重要 对于 RTX 5000 来说,一个最明显的例子是 **更高阶的帧生成(3x/4x)**。 这引发了一个非常自然的技术问题: ## 本仓库的目的 本仓库记录了我对 **GeForce RTX 4000 系列** GPU 上强制 **DLSS 4 多帧生成 3x/4x** 行为的研究。 该项目目前聚焦于三个方面: 1. 记录观察到的运行时行为 2. 使用 **NVIDIA Nsight Systems 2026.2.1** 验证帧呈现行为 3. 调查驱动层黑屏强制执行的路径 这 **不是** 一个现成的解锁包。 它是一个公开的科研日志。 ## 当前状态(一句话总结) 目前,我的结论是: 这一结论基于: - 可重复的基准测试行为 - 公开的 3DMark 跑分 - 本地《赛博朋克 2077》测试 - 对帧呈现的直接 Nsight 分析 ## 基本激活路径 在 RTX 4000 上激活 FG 3x/4x 并不特别困难,从前端即可操作。 **[NVIDIA Profile Inspector](https://github.com/Orbmu2k/nvidiaProfileInspector)** 可用于全局设置帧生成倍率,绕开 NVIDIA App 的锁定。 image 该设置随后会在 NVIDIA App 中显示(只读)。 image ## 重要更新 — 我最初的 `ShowEvalModeOverlay` 理论是错误的 我使用 [**Ghidra**](https://github.com/NationalSecurityAgency/ghidra)(由美国国家安全局开发)对 `nvlddmkm.sys` 进行了静态分析。 Ghidra 早期版本的本仓库曾暗示,`nvlddmkm.sys` 中的 `ShowEvalModeOverlay` 字符串可能直接导致在 **RTX 4000 系列** 上启用 **MFG 3x/4x** 后出现全屏黑输出。 经过进一步研究,我可以明确指出: 测试的字节级控制流修改 **并未** 禁用黑图像/黑屏行为。 它实际禁用的是 **NVIDIA App 覆盖菜单** 功能 — 也就是用于以下功能的游戏内覆盖层: - 录制 - 截图 - 性能统计 - 及相关覆盖 UI 因此 `ShowEvalModeOverlay` 被证明是一条 **错误线索**。 然而,这仍然是有价值的研究,因为它揭示了: - 精确的低级修改可以改变驱动行为 **而不破坏驱动本身** - 精心定位的侵入式补丁 **不一定** 会损坏或使修改后的 NVIDIA 内核驱动不稳定 - 在此研究过程中,我也确认了即使启用 **Secure Boot**,也可以安装 **新修改的内核驱动**(细节此处未披露) image 因此,尽管该分支 **不是** 黑屏开关,但这项工作仍然发现了关于驱动健壮性和补丁行为的重要信息。 ## 主要问题 — 黑图像 / 黑输出强制执行 在启用 **RTX 4000 系列上的帧生成 3x/4x** 后,会一致出现意外行为: ### 观察到的行为 - NVIDIA App 报告预期的 FPS 缩放 - 游戏仍可交互 - 帧时序保持一致 - 音频正常 - 基准测试正确检测到生成的帧 这强烈表明渲染路径 **并非简单崩溃**。 相反,输出似乎是 **被故意遮蔽** 的。 ## 推动本研究的外部参考 推动我继续深入的主要外部参考是这段中文媒体视频: - **NVIDIA GeForce RTX 4080 笔记本 / Arch Linux / MFG 4x 在《赛博朋克 2077》中**:[Bilibili 视频](https://www.bilibili.com/video/BV1nVAWeAEg1) - **NVIDIA GeForce RTX 4080 笔记本 / Windows / MFG 4x 在《赛博朋克 2077》中**:[Bilibili 视频](https://www.bilibili.com/video/BV1WZfZYxEtQ) 本仓库仅将这些视频作为 **外部背景 / 动机** 使用,并非核心证明。 我自己的观察表明,其中展示的内容是真实的,并且与本地结果方向一致。 不过,这里收集的最强证据仍来自本地测试和 Nsight 分析。 ## 基准测试证据 ### 3DMark NVIDIA DLSS 特性测试 | DLSS FG 模式 | DLSS 关闭 | DLSS 开启 | 倍率 | |---------------------|----------|---------|------------| | 帧生成 2x | 32.27 FPS | 125.16 FPS | 3.9x | | 帧生成 3x | 32.16 FPS | 224.02 FPS | 7.0x | | 帧生成 4x | 32.20 FPS | 291.56 FPS | 9.1x | | [DLSS 4 帧生成 2x](https://www.3dmark.com/nd/580395) | [DLSS 4 帧生成 3x](https://www.3dmark.com/nd/580396) | [DLSS 4 帧生成 4x](https://www.3dmark.com/nd/580397) | |:---------------:|:--------------:|:-------------------:| | ![DLSS 4 帧生成 2x](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/84644de429040942.png) | ![DLSS 4 帧生成 3x](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/a7a8459d41040944.png) | ![DLSS 4 帧生成 4x](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/dc052f04d7040947.png) | **已验证的官方 3DMark 结果:** https://www.3dmark.com/compare/nd/580395/nd/580396/nd/580397 3DMark_2x_3x_4x ### 《赛博朋克 2077》内置基准 — 光线追踪:超高,4K | 模式 | 平均 FPS | 最低 FPS | 最高 FPS | |------|--------:|--------:|--------:| | FG 2x | 75.83 | 69.78 | 82.18 | | FG 3x | 124.49 | 113.24 | 136.96 | | FG 4x | 164.68 | 149.75 | 180.54 | | DLSS 4 帧生成 2x | DLSS 4 帧生成 3x | DLSS 4 帧生成 4x | |:---:|:---:|:---:| | ![DLSS 4 帧生成 2x](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/9c5909bcd1040950.png) | ![DLSS 4 帧生成 3x](https://github.com/user-attachments/assets/ff6b3315-f1cb-46a3-84eb-6af3f353d0d) | ![DLSS 4 帧生成 4x](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/23c46cf499040954.png) | 这些结果本身 **不能** 证明画质完美。 但它们确实表明: - 性能提升是可重复的 - 缩放在内部是一致的 - 帧生成路径已经足够活跃,能够被外部工具测量 image 完整的 3DMark 结果文件(`.3dmark-result`)可在 [**发布页面**](https://github.com/FirstEverTech/RTX4000-MFG-Unlock/releases) 下载。 下载后可在本地用 3DMark 打开,检查帧时间图表并自行验证结果。 ## 为何我转向使用 Nsight Systems 一旦 `ShowEvalModeOverlay` 理论不再成立,最合理的选择是停止猜测驱动中的某个分支含义,而是直接检查帧流水线。 因此,我在匹配条件下捕获了三份 Nsight Systems 跟踪: - `CP2077-fg2x.nsys-rep` - `CP2077-fg3x.nsys-rep` - `CP2077-fg4x.nsys-rep` ### 捕获设置 - **应用**:赛博朋克 2077 - **模式**:内置基准 - **预设**:光线追踪:超高 - **分辨率**:4K - **工具**:NVIDIA Nsight Systems 2026.2.1 - **捕获时长**:10 秒 - **目标**:在相同可重复场景路径下比较 FG 2x 与 FG 3x 与 FG 4x 的实际呈现行为 image ## Nsight 分析所展示的内容 一份完整的独立 Nsight 分析报告计划作为 **发布资产** 提供: - `RTX4000_MFG_Nsight_Technical_Note.md` 该文件旨在配合原始捕获文件使用: - `CP2077-fg2x.nsys-rep` - `CP2077-fg3x.nsys-rep` - `CP2077-fg4x.nsys-rep` ### 发现的简要总结 Nsight 中的主要模式非常清晰: - **FG 2x** 在 **2 个呈现/基础周期** 内分组 - **FG 3x** 在 **3 个呈现/基础周期** 内分组 - **FG 4x** 在 **4 个呈现/基础周期** 内分组 在稳定的分析窗口中,估算的基础渲染速率保持在相似范围,而呈现数量随所选模式按比例扩展: | 模式 | 呈现 FPS | 估算基础渲染周期/s | 主要数据包大小 | |------|------------:|-------------------------------:|---------------------:| | FG 2x | 72.25 | 36.20 | 2 | | FG 3x | 111.60 | 37.20 | 3 | | FG 4x | 153.80 | 38.45 | 4 | 这很重要,因为它 **看起来不像简单的假 FPS 计数器提升**。 看起来像是一个实际输出额外呈现的管线,其数据包结构与所选倍率一致。 | 单个基准段中的呈现事件 | 输出呈现速率与估算基础渲染周期对比 | |:---------------:|:--------------: | ![figure_1_present_excerpt](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/99a08a5ded040956.png) | ![figure_2_delta_histogram](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/7b4a190e72040958.png) | | 基于 >12 毫秒间隔的数据包大小推断 | 20–40 秒分析窗口内的呈现间隔分布 | | ![figure_3_rates](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/1fe0e535f7041001.png) | ![figure_4_packet_sizes](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/c2d8fe4781041003.png) | ## 我目前根据数据支持的结论 基于基准测试数据和 Nsight 捕获,我的当前结论是: 这个结论比单纯说: - “FPS 计数器上升了” - “3DMark 报告了更大的数值” - “它只是重播完全相同的已完成帧” 要更有力得多。 同时,我也希望保持精确和谨慎: ## 目前尚未证明的内容 当前数据 **尚未** 完全证明: - 图像质量与原生 RTX 5000 系列 MFG 完全一致 - 运动质量在所有边缘情况下都一致 - 延迟行为一致 - 每个生成的帧在感知上都同样优秀 - 所有驱动层强制逻辑都已被理解 因此,诚实的结论 **不是**: 诚实的结论是: ## 发布结构 本项目的预期 **发布** 包包含: - 原始 Nsight 捕获文件: - `CP2077-fg2x.nsys-rep` - `CP2077-fg3x.nsys-rep` - `CP2077-fg4x.nsys-rep` - 独立的补充分析: - `RTX4000_MFG_Nsight_Technical_Note.md` - `RTX4000_MFG_Nsight_Technical_Note.pdf` - 可选的分析图表导出 - 可选的基准工件,例如 `.3dmark-result` 文件 这样人们可以: 1. 阅读 README 中的简要版本 2. 检查更深入的技术说明 3. 并独立验证原始捕获材料 **发布页面:** https://github.com/FirstEverTech/RTX4000-MFG-Unlock/releases ## 当前工作 目前的主要研究方向是: 这项工作缓慢且耗时。 每一次错误引导都可能耗费数小时。 但 Nsight 的发现正是该项目值得继续推进的原因:它们表明黑屏之下可能发生了有意义的事情。 ## 如果你想提供帮助 有用的贡献包括: 1. 对分析的同行评审 2. 在其他 RTX 4000 显卡上的额外测试 3. 来自其他游戏/场景的 Nsight 捕获 4. 强制 RTX 4000 MFG 与原生 RTX 5000 MFG 的图像质量对比 5. 驱动行为的独立技术讨论 如果你复现了类似结果,请随时通过以下方式打开问题或讨论: - GPU 型号 - 驱动版本 - 游戏/场景 - 测试方法 - 捕获文件 - 观察到的黑输出行为 ## 支持本项目 该项目在我的业余时间开发,当前阶段的工作 **极其耗时**。如果你发现这项研究有用并希望支持进一步的黑屏强制路径研究,欢迎捐赠。 [![PayPal](https://img.shields.io/badge/PayPal-Support_Development-00457C?style=for-the-badge&logo=paypal)](https://www.paypal.com/donate/?hosted_button_id=48VGDSCNJAPTJ)[![Buy Me a Coffee](https://img.shields.io/badge/Buy_Me_a_Coffee-Support_Work-FFDD00?style=for-the-badge&logo=buymeacoffee)](https://buymeacoffee.com/firstevertech)[![GitHub Sponsors](https://img.shields.io/badge/GitHub-Sponsor-EA4AAA?style=for-the-badge&logo=githubsponsors)](https://github.com/sponsors/FirstEverTech) 每一份贡献都帮助覆盖了更多时间花费在: - 逆向工程 - 控制测试 - Nsight 分析 - 结果文档 - 发布原始材料供独立审查 ## 免责声明 / 法律声明 本仓库严格仅用于: - 研究 - 教育 - 文档 - 技术讨论 它 **不** 分发修改后的 NVIDIA 驱动或二进制文件。 它 **不** 提供现成的绕过包。 它 **不** 披露用于安装修改内核驱动的方法。 它 **不** 鼓励用户削弱平台安全性或违反软件许可协议。 所有商标、产品名称和技术均其各自所有者所有。 请负责任地、遵守适用法律、许可协议和平台政策使用这些信息。 ## 作者与联系方式 **Marcin Grygiel**(又名 **FirstEver**) - 🌐 网站:https://www.firstever.tech - 💼 LinkedIn:https://www.linkedin.com/in/marcin-grygiel/ - 🔧 GitHub:https://github.com/FirstEverTech - 📧 联系:https://www.firstever.tech/contact
标签:3x, 4x, AI 加速, benchmark, DLSS, GeForce, GPU, Multi Frame Generation, Nsight Systems, RTX 4000, UML, 帧呈现, 帧生成, 性能测试, 显卡, 显卡升级, 显卡性能分析, 显卡超频, 深度学习, 游戏优化, 超分辨率, 软件特征解锁, 逆向工具, 驱动, 驱动级限制, 黑屏检测