FirstEverTech/RTX4000-MFG-Unlock
GitHub: FirstEverTech/RTX4000-MFG-Unlock
本仓库记录了在RTX 4000系列上研究DLSS 4多帧生成3x/4x的科研过程,旨在揭示其性能与呈现行为边界。
Stars: 1 | Forks: 0
# NVIDIA GeForce RTX 4000 系列 — DLSS 4 多帧生成 3x/4x 研究
最近我一直在研究各种项目 — 其中一些人可能知道我的工作:
- **[通用英特尔芯片组设备更新器](https://github.com/FirstEverTech/Universal-Intel-Chipset-Updater)**
- **[通用英特尔 Wi‑Fi 和蓝牙驱动更新器](https://github.com/FirstEverTech/Universal-Intel-WiFi-BT-Updater)**
这一次,我开始对一件困扰我一段时间的事情感兴趣:
## **在 RTX 4000 系列显卡上实现 DLSS 4 多帧生成 3x/4x**
## 为何这个项目存在
很难不注意到 NVIDIA 越来越多地利用软件功能作为不同代产品之间的差异化卖点。
与此同时:
- GPU 价格在上涨
- 原生代际性能提升往往有限
- 软件锁定功能在产品细分中变得越来越重要
对于 RTX 5000 来说,一个最明显的例子是 **更高阶的帧生成(3x/4x)**。
这引发了一个非常自然的技术问题:
## 本仓库的目的
本仓库记录了我对 **GeForce RTX 4000 系列** GPU 上强制 **DLSS 4 多帧生成 3x/4x** 行为的研究。
该项目目前聚焦于三个方面:
1. 记录观察到的运行时行为
2. 使用 **NVIDIA Nsight Systems 2026.2.1** 验证帧呈现行为
3. 调查驱动层黑屏强制执行的路径
这 **不是** 一个现成的解锁包。
它是一个公开的科研日志。
## 当前状态(一句话总结)
目前,我的结论是:
这一结论基于:
- 可重复的基准测试行为
- 公开的 3DMark 跑分
- 本地《赛博朋克 2077》测试
- 对帧呈现的直接 Nsight 分析
## 基本激活路径
在 RTX 4000 上激活 FG 3x/4x 并不特别困难,从前端即可操作。
**[NVIDIA Profile Inspector](https://github.com/Orbmu2k/nvidiaProfileInspector)** 可用于全局设置帧生成倍率,绕开 NVIDIA App 的锁定。
该设置随后会在 NVIDIA App 中显示(只读)。
## 重要更新 — 我最初的 `ShowEvalModeOverlay` 理论是错误的
我使用 [**Ghidra**](https://github.com/NationalSecurityAgency/ghidra)(由美国国家安全局开发)对 `nvlddmkm.sys` 进行了静态分析。
早期版本的本仓库曾暗示,`nvlddmkm.sys` 中的 `ShowEvalModeOverlay` 字符串可能直接导致在 **RTX 4000 系列** 上启用 **MFG 3x/4x** 后出现全屏黑输出。
经过进一步研究,我可以明确指出:
测试的字节级控制流修改 **并未** 禁用黑图像/黑屏行为。
它实际禁用的是 **NVIDIA App 覆盖菜单** 功能 — 也就是用于以下功能的游戏内覆盖层:
- 录制
- 截图
- 性能统计
- 及相关覆盖 UI
因此 `ShowEvalModeOverlay` 被证明是一条 **错误线索**。
然而,这仍然是有价值的研究,因为它揭示了:
- 精确的低级修改可以改变驱动行为 **而不破坏驱动本身**
- 精心定位的侵入式补丁 **不一定** 会损坏或使修改后的 NVIDIA 内核驱动不稳定
- 在此研究过程中,我也确认了即使启用 **Secure Boot**,也可以安装 **新修改的内核驱动**(细节此处未披露)
因此,尽管该分支 **不是** 黑屏开关,但这项工作仍然发现了关于驱动健壮性和补丁行为的重要信息。
## 主要问题 — 黑图像 / 黑输出强制执行
在启用 **RTX 4000 系列上的帧生成 3x/4x** 后,会一致出现意外行为:
### 观察到的行为
- NVIDIA App 报告预期的 FPS 缩放
- 游戏仍可交互
- 帧时序保持一致
- 音频正常
- 基准测试正确检测到生成的帧
这强烈表明渲染路径 **并非简单崩溃**。
相反,输出似乎是 **被故意遮蔽** 的。
## 推动本研究的外部参考
推动我继续深入的主要外部参考是这段中文媒体视频:
- **NVIDIA GeForce RTX 4080 笔记本 / Arch Linux / MFG 4x 在《赛博朋克 2077》中**:[Bilibili 视频](https://www.bilibili.com/video/BV1nVAWeAEg1)
- **NVIDIA GeForce RTX 4080 笔记本 / Windows / MFG 4x 在《赛博朋克 2077》中**:[Bilibili 视频](https://www.bilibili.com/video/BV1WZfZYxEtQ)
本仓库仅将这些视频作为 **外部背景 / 动机** 使用,并非核心证明。
我自己的观察表明,其中展示的内容是真实的,并且与本地结果方向一致。
不过,这里收集的最强证据仍来自本地测试和 Nsight 分析。
## 基准测试证据
### 3DMark NVIDIA DLSS 特性测试
| DLSS FG 模式 | DLSS 关闭 | DLSS 开启 | 倍率 |
|---------------------|----------|---------|------------|
| 帧生成 2x | 32.27 FPS | 125.16 FPS | 3.9x |
| 帧生成 3x | 32.16 FPS | 224.02 FPS | 7.0x |
| 帧生成 4x | 32.20 FPS | 291.56 FPS | 9.1x |
| [DLSS 4 帧生成 2x](https://www.3dmark.com/nd/580395) | [DLSS 4 帧生成 3x](https://www.3dmark.com/nd/580396) | [DLSS 4 帧生成 4x](https://www.3dmark.com/nd/580397) |
|:---------------:|:--------------:|:-------------------:|
|  |  |  |
**已验证的官方 3DMark 结果:**
https://www.3dmark.com/compare/nd/580395/nd/580396/nd/580397
### 《赛博朋克 2077》内置基准 — 光线追踪:超高,4K
| 模式 | 平均 FPS | 最低 FPS | 最高 FPS |
|------|--------:|--------:|--------:|
| FG 2x | 75.83 | 69.78 | 82.18 |
| FG 3x | 124.49 | 113.24 | 136.96 |
| FG 4x | 164.68 | 149.75 | 180.54 |
| DLSS 4 帧生成 2x | DLSS 4 帧生成 3x | DLSS 4 帧生成 4x |
|:---:|:---:|:---:|
|  |  |  |
这些结果本身 **不能** 证明画质完美。
但它们确实表明:
- 性能提升是可重复的
- 缩放在内部是一致的
- 帧生成路径已经足够活跃,能够被外部工具测量
完整的 3DMark 结果文件(`.3dmark-result`)可在 [**发布页面**](https://github.com/FirstEverTech/RTX4000-MFG-Unlock/releases) 下载。
下载后可在本地用 3DMark 打开,检查帧时间图表并自行验证结果。
## 为何我转向使用 Nsight Systems
一旦 `ShowEvalModeOverlay` 理论不再成立,最合理的选择是停止猜测驱动中的某个分支含义,而是直接检查帧流水线。
因此,我在匹配条件下捕获了三份 Nsight Systems 跟踪:
- `CP2077-fg2x.nsys-rep`
- `CP2077-fg3x.nsys-rep`
- `CP2077-fg4x.nsys-rep`
### 捕获设置
- **应用**:赛博朋克 2077
- **模式**:内置基准
- **预设**:光线追踪:超高
- **分辨率**:4K
- **工具**:NVIDIA Nsight Systems 2026.2.1
- **捕获时长**:10 秒
- **目标**:在相同可重复场景路径下比较 FG 2x 与 FG 3x 与 FG 4x 的实际呈现行为
## Nsight 分析所展示的内容
一份完整的独立 Nsight 分析报告计划作为 **发布资产** 提供:
- `RTX4000_MFG_Nsight_Technical_Note.md`
该文件旨在配合原始捕获文件使用:
- `CP2077-fg2x.nsys-rep`
- `CP2077-fg3x.nsys-rep`
- `CP2077-fg4x.nsys-rep`
### 发现的简要总结
Nsight 中的主要模式非常清晰:
- **FG 2x** 在 **2 个呈现/基础周期** 内分组
- **FG 3x** 在 **3 个呈现/基础周期** 内分组
- **FG 4x** 在 **4 个呈现/基础周期** 内分组
在稳定的分析窗口中,估算的基础渲染速率保持在相似范围,而呈现数量随所选模式按比例扩展:
| 模式 | 呈现 FPS | 估算基础渲染周期/s | 主要数据包大小 |
|------|------------:|-------------------------------:|---------------------:|
| FG 2x | 72.25 | 36.20 | 2 |
| FG 3x | 111.60 | 37.20 | 3 |
| FG 4x | 153.80 | 38.45 | 4 |
这很重要,因为它 **看起来不像简单的假 FPS 计数器提升**。
看起来像是一个实际输出额外呈现的管线,其数据包结构与所选倍率一致。
| 单个基准段中的呈现事件 | 输出呈现速率与估算基础渲染周期对比 |
|:---------------:|:--------------:
|  |  |
| 基于 >12 毫秒间隔的数据包大小推断 | 20–40 秒分析窗口内的呈现间隔分布 |
|  |  |
## 我目前根据数据支持的结论
基于基准测试数据和 Nsight 捕获,我的当前结论是:
这个结论比单纯说:
- “FPS 计数器上升了”
- “3DMark 报告了更大的数值”
- “它只是重播完全相同的已完成帧”
要更有力得多。
同时,我也希望保持精确和谨慎:
## 目前尚未证明的内容
当前数据 **尚未** 完全证明:
- 图像质量与原生 RTX 5000 系列 MFG 完全一致
- 运动质量在所有边缘情况下都一致
- 延迟行为一致
- 每个生成的帧在感知上都同样优秀
- 所有驱动层强制逻辑都已被理解
因此,诚实的结论 **不是**:
诚实的结论是:
## 发布结构
本项目的预期 **发布** 包包含:
- 原始 Nsight 捕获文件:
- `CP2077-fg2x.nsys-rep`
- `CP2077-fg3x.nsys-rep`
- `CP2077-fg4x.nsys-rep`
- 独立的补充分析:
- `RTX4000_MFG_Nsight_Technical_Note.md`
- `RTX4000_MFG_Nsight_Technical_Note.pdf`
- 可选的分析图表导出
- 可选的基准工件,例如 `.3dmark-result` 文件
这样人们可以:
1. 阅读 README 中的简要版本
2. 检查更深入的技术说明
3. 并独立验证原始捕获材料
**发布页面:** https://github.com/FirstEverTech/RTX4000-MFG-Unlock/releases
## 当前工作
目前的主要研究方向是:
这项工作缓慢且耗时。
每一次错误引导都可能耗费数小时。
但 Nsight 的发现正是该项目值得继续推进的原因:它们表明黑屏之下可能发生了有意义的事情。
## 如果你想提供帮助
有用的贡献包括:
1. 对分析的同行评审
2. 在其他 RTX 4000 显卡上的额外测试
3. 来自其他游戏/场景的 Nsight 捕获
4. 强制 RTX 4000 MFG 与原生 RTX 5000 MFG 的图像质量对比
5. 驱动行为的独立技术讨论
如果你复现了类似结果,请随时通过以下方式打开问题或讨论:
- GPU 型号
- 驱动版本
- 游戏/场景
- 测试方法
- 捕获文件
- 观察到的黑输出行为
## 支持本项目
该项目在我的业余时间开发,当前阶段的工作 **极其耗时**。如果你发现这项研究有用并希望支持进一步的黑屏强制路径研究,欢迎捐赠。
[](https://www.paypal.com/donate/?hosted_button_id=48VGDSCNJAPTJ)[](https://buymeacoffee.com/firstevertech)[](https://github.com/sponsors/FirstEverTech)
每一份贡献都帮助覆盖了更多时间花费在:
- 逆向工程
- 控制测试
- Nsight 分析
- 结果文档
- 发布原始材料供独立审查
## 免责声明 / 法律声明
本仓库严格仅用于:
- 研究
- 教育
- 文档
- 技术讨论
它 **不** 分发修改后的 NVIDIA 驱动或二进制文件。
它 **不** 提供现成的绕过包。
它 **不** 披露用于安装修改内核驱动的方法。
它 **不** 鼓励用户削弱平台安全性或违反软件许可协议。
所有商标、产品名称和技术均其各自所有者所有。
请负责任地、遵守适用法律、许可协议和平台政策使用这些信息。
## 作者与联系方式
**Marcin Grygiel**(又名 **FirstEver**)
- 🌐 网站:https://www.firstever.tech
- 💼 LinkedIn:https://www.linkedin.com/in/marcin-grygiel/
- 🔧 GitHub:https://github.com/FirstEverTech
- 📧 联系:https://www.firstever.tech/contact
## 为何这个项目存在
很难不注意到 NVIDIA 越来越多地利用软件功能作为不同代产品之间的差异化卖点。
与此同时:
- GPU 价格在上涨
- 原生代际性能提升往往有限
- 软件锁定功能在产品细分中变得越来越重要
对于 RTX 5000 来说,一个最明显的例子是 **更高阶的帧生成(3x/4x)**。
这引发了一个非常自然的技术问题:
## 本仓库的目的
本仓库记录了我对 **GeForce RTX 4000 系列** GPU 上强制 **DLSS 4 多帧生成 3x/4x** 行为的研究。
该项目目前聚焦于三个方面:
1. 记录观察到的运行时行为
2. 使用 **NVIDIA Nsight Systems 2026.2.1** 验证帧呈现行为
3. 调查驱动层黑屏强制执行的路径
这 **不是** 一个现成的解锁包。
它是一个公开的科研日志。
## 当前状态(一句话总结)
目前,我的结论是:
这一结论基于:
- 可重复的基准测试行为
- 公开的 3DMark 跑分
- 本地《赛博朋克 2077》测试
- 对帧呈现的直接 Nsight 分析
## 基本激活路径
在 RTX 4000 上激活 FG 3x/4x 并不特别困难,从前端即可操作。
**[NVIDIA Profile Inspector](https://github.com/Orbmu2k/nvidiaProfileInspector)** 可用于全局设置帧生成倍率,绕开 NVIDIA App 的锁定。
该设置随后会在 NVIDIA App 中显示(只读)。
## 重要更新 — 我最初的 `ShowEvalModeOverlay` 理论是错误的
我使用 [**Ghidra**](https://github.com/NationalSecurityAgency/ghidra)(由美国国家安全局开发)对 `nvlddmkm.sys` 进行了静态分析。
早期版本的本仓库曾暗示,`nvlddmkm.sys` 中的 `ShowEvalModeOverlay` 字符串可能直接导致在 **RTX 4000 系列** 上启用 **MFG 3x/4x** 后出现全屏黑输出。
经过进一步研究,我可以明确指出:
测试的字节级控制流修改 **并未** 禁用黑图像/黑屏行为。
它实际禁用的是 **NVIDIA App 覆盖菜单** 功能 — 也就是用于以下功能的游戏内覆盖层:
- 录制
- 截图
- 性能统计
- 及相关覆盖 UI
因此 `ShowEvalModeOverlay` 被证明是一条 **错误线索**。
然而,这仍然是有价值的研究,因为它揭示了:
- 精确的低级修改可以改变驱动行为 **而不破坏驱动本身**
- 精心定位的侵入式补丁 **不一定** 会损坏或使修改后的 NVIDIA 内核驱动不稳定
- 在此研究过程中,我也确认了即使启用 **Secure Boot**,也可以安装 **新修改的内核驱动**(细节此处未披露)
因此,尽管该分支 **不是** 黑屏开关,但这项工作仍然发现了关于驱动健壮性和补丁行为的重要信息。
## 主要问题 — 黑图像 / 黑输出强制执行
在启用 **RTX 4000 系列上的帧生成 3x/4x** 后,会一致出现意外行为:
### 观察到的行为
- NVIDIA App 报告预期的 FPS 缩放
- 游戏仍可交互
- 帧时序保持一致
- 音频正常
- 基准测试正确检测到生成的帧
这强烈表明渲染路径 **并非简单崩溃**。
相反,输出似乎是 **被故意遮蔽** 的。
## 推动本研究的外部参考
推动我继续深入的主要外部参考是这段中文媒体视频:
- **NVIDIA GeForce RTX 4080 笔记本 / Arch Linux / MFG 4x 在《赛博朋克 2077》中**:[Bilibili 视频](https://www.bilibili.com/video/BV1nVAWeAEg1)
- **NVIDIA GeForce RTX 4080 笔记本 / Windows / MFG 4x 在《赛博朋克 2077》中**:[Bilibili 视频](https://www.bilibili.com/video/BV1WZfZYxEtQ)
本仓库仅将这些视频作为 **外部背景 / 动机** 使用,并非核心证明。
我自己的观察表明,其中展示的内容是真实的,并且与本地结果方向一致。
不过,这里收集的最强证据仍来自本地测试和 Nsight 分析。
## 基准测试证据
### 3DMark NVIDIA DLSS 特性测试
| DLSS FG 模式 | DLSS 关闭 | DLSS 开启 | 倍率 |
|---------------------|----------|---------|------------|
| 帧生成 2x | 32.27 FPS | 125.16 FPS | 3.9x |
| 帧生成 3x | 32.16 FPS | 224.02 FPS | 7.0x |
| 帧生成 4x | 32.20 FPS | 291.56 FPS | 9.1x |
| [DLSS 4 帧生成 2x](https://www.3dmark.com/nd/580395) | [DLSS 4 帧生成 3x](https://www.3dmark.com/nd/580396) | [DLSS 4 帧生成 4x](https://www.3dmark.com/nd/580397) |
|:---------------:|:--------------:|:-------------------:|
|  |  |  |
**已验证的官方 3DMark 结果:**
https://www.3dmark.com/compare/nd/580395/nd/580396/nd/580397
### 《赛博朋克 2077》内置基准 — 光线追踪:超高,4K
| 模式 | 平均 FPS | 最低 FPS | 最高 FPS |
|------|--------:|--------:|--------:|
| FG 2x | 75.83 | 69.78 | 82.18 |
| FG 3x | 124.49 | 113.24 | 136.96 |
| FG 4x | 164.68 | 149.75 | 180.54 |
| DLSS 4 帧生成 2x | DLSS 4 帧生成 3x | DLSS 4 帧生成 4x |
|:---:|:---:|:---:|
|  |  |  |
这些结果本身 **不能** 证明画质完美。
但它们确实表明:
- 性能提升是可重复的
- 缩放在内部是一致的
- 帧生成路径已经足够活跃,能够被外部工具测量
完整的 3DMark 结果文件(`.3dmark-result`)可在 [**发布页面**](https://github.com/FirstEverTech/RTX4000-MFG-Unlock/releases) 下载。
下载后可在本地用 3DMark 打开,检查帧时间图表并自行验证结果。
## 为何我转向使用 Nsight Systems
一旦 `ShowEvalModeOverlay` 理论不再成立,最合理的选择是停止猜测驱动中的某个分支含义,而是直接检查帧流水线。
因此,我在匹配条件下捕获了三份 Nsight Systems 跟踪:
- `CP2077-fg2x.nsys-rep`
- `CP2077-fg3x.nsys-rep`
- `CP2077-fg4x.nsys-rep`
### 捕获设置
- **应用**:赛博朋克 2077
- **模式**:内置基准
- **预设**:光线追踪:超高
- **分辨率**:4K
- **工具**:NVIDIA Nsight Systems 2026.2.1
- **捕获时长**:10 秒
- **目标**:在相同可重复场景路径下比较 FG 2x 与 FG 3x 与 FG 4x 的实际呈现行为
## Nsight 分析所展示的内容
一份完整的独立 Nsight 分析报告计划作为 **发布资产** 提供:
- `RTX4000_MFG_Nsight_Technical_Note.md`
该文件旨在配合原始捕获文件使用:
- `CP2077-fg2x.nsys-rep`
- `CP2077-fg3x.nsys-rep`
- `CP2077-fg4x.nsys-rep`
### 发现的简要总结
Nsight 中的主要模式非常清晰:
- **FG 2x** 在 **2 个呈现/基础周期** 内分组
- **FG 3x** 在 **3 个呈现/基础周期** 内分组
- **FG 4x** 在 **4 个呈现/基础周期** 内分组
在稳定的分析窗口中,估算的基础渲染速率保持在相似范围,而呈现数量随所选模式按比例扩展:
| 模式 | 呈现 FPS | 估算基础渲染周期/s | 主要数据包大小 |
|------|------------:|-------------------------------:|---------------------:|
| FG 2x | 72.25 | 36.20 | 2 |
| FG 3x | 111.60 | 37.20 | 3 |
| FG 4x | 153.80 | 38.45 | 4 |
这很重要,因为它 **看起来不像简单的假 FPS 计数器提升**。
看起来像是一个实际输出额外呈现的管线,其数据包结构与所选倍率一致。
| 单个基准段中的呈现事件 | 输出呈现速率与估算基础渲染周期对比 |
|:---------------:|:--------------:
|  |  |
| 基于 >12 毫秒间隔的数据包大小推断 | 20–40 秒分析窗口内的呈现间隔分布 |
|  |  |
## 我目前根据数据支持的结论
基于基准测试数据和 Nsight 捕获,我的当前结论是:
这个结论比单纯说:
- “FPS 计数器上升了”
- “3DMark 报告了更大的数值”
- “它只是重播完全相同的已完成帧”
要更有力得多。
同时,我也希望保持精确和谨慎:
## 目前尚未证明的内容
当前数据 **尚未** 完全证明:
- 图像质量与原生 RTX 5000 系列 MFG 完全一致
- 运动质量在所有边缘情况下都一致
- 延迟行为一致
- 每个生成的帧在感知上都同样优秀
- 所有驱动层强制逻辑都已被理解
因此,诚实的结论 **不是**:
诚实的结论是:
## 发布结构
本项目的预期 **发布** 包包含:
- 原始 Nsight 捕获文件:
- `CP2077-fg2x.nsys-rep`
- `CP2077-fg3x.nsys-rep`
- `CP2077-fg4x.nsys-rep`
- 独立的补充分析:
- `RTX4000_MFG_Nsight_Technical_Note.md`
- `RTX4000_MFG_Nsight_Technical_Note.pdf`
- 可选的分析图表导出
- 可选的基准工件,例如 `.3dmark-result` 文件
这样人们可以:
1. 阅读 README 中的简要版本
2. 检查更深入的技术说明
3. 并独立验证原始捕获材料
**发布页面:** https://github.com/FirstEverTech/RTX4000-MFG-Unlock/releases
## 当前工作
目前的主要研究方向是:
这项工作缓慢且耗时。
每一次错误引导都可能耗费数小时。
但 Nsight 的发现正是该项目值得继续推进的原因:它们表明黑屏之下可能发生了有意义的事情。
## 如果你想提供帮助
有用的贡献包括:
1. 对分析的同行评审
2. 在其他 RTX 4000 显卡上的额外测试
3. 来自其他游戏/场景的 Nsight 捕获
4. 强制 RTX 4000 MFG 与原生 RTX 5000 MFG 的图像质量对比
5. 驱动行为的独立技术讨论
如果你复现了类似结果,请随时通过以下方式打开问题或讨论:
- GPU 型号
- 驱动版本
- 游戏/场景
- 测试方法
- 捕获文件
- 观察到的黑输出行为
## 支持本项目
该项目在我的业余时间开发,当前阶段的工作 **极其耗时**。如果你发现这项研究有用并希望支持进一步的黑屏强制路径研究,欢迎捐赠。
[](https://www.paypal.com/donate/?hosted_button_id=48VGDSCNJAPTJ)[](https://buymeacoffee.com/firstevertech)[](https://github.com/sponsors/FirstEverTech)
每一份贡献都帮助覆盖了更多时间花费在:
- 逆向工程
- 控制测试
- Nsight 分析
- 结果文档
- 发布原始材料供独立审查
## 免责声明 / 法律声明
本仓库严格仅用于:
- 研究
- 教育
- 文档
- 技术讨论
它 **不** 分发修改后的 NVIDIA 驱动或二进制文件。
它 **不** 提供现成的绕过包。
它 **不** 披露用于安装修改内核驱动的方法。
它 **不** 鼓励用户削弱平台安全性或违反软件许可协议。
所有商标、产品名称和技术均其各自所有者所有。
请负责任地、遵守适用法律、许可协议和平台政策使用这些信息。
## 作者与联系方式
**Marcin Grygiel**(又名 **FirstEver**)
- 🌐 网站:https://www.firstever.tech
- 💼 LinkedIn:https://www.linkedin.com/in/marcin-grygiel/
- 🔧 GitHub:https://github.com/FirstEverTech
- 📧 联系:https://www.firstever.tech/contact标签:3x, 4x, AI 加速, benchmark, DLSS, GeForce, GPU, Multi Frame Generation, Nsight Systems, RTX 4000, UML, 帧呈现, 帧生成, 性能测试, 显卡, 显卡升级, 显卡性能分析, 显卡超频, 深度学习, 游戏优化, 超分辨率, 软件特征解锁, 逆向工具, 驱动, 驱动级限制, 黑屏检测