在 GeForce RTX 40 系列发布之后,我们邀请了七位 NVIDIA 产品经理,针对玩家关注的焦点问题举行了相关问答活动。虽然不能解答全体玩家的所有问题,但我们的专家依然对最备受关注的问题进行了解答。
GeForce RTX 40 系列
问:如果 RTX 4080 16 GB 和 12 GB 显卡拥有并不相同的 CUDA Core 核心数量,甚至是不同的芯片,那么它们为何都被称为“RTX 4080”?
RTX 4080 16GB 和 12GB 的命名延续了上一代 两个 RTX 3080 不同版本,乃至之前其它类似产品的命名方式。RTX 4080 提供两种规格,一种具有 16GB 显存,另一种具有 12GB 显存,即一个产品名称,两种规格。
4080 12GB 是一款出色的 GPU,性能超过了上一代旗舰产品 RTX 3090 Ti,凭借 DLSS 3的支持,其性能甚至能够达到 RTX 3080 Ti 性能的 3 倍左右,完全有理由相信它是一款优秀的 80 级 GPU。我们了解许多游戏玩家可能想要一个更高规格的选择,而 RTX 4080 16GB 恰好能提供更大的显存和更高的性能。两个版本的包装、产品细节和销售推广都将会明显不同,因此游戏玩家和创作者可以轻松选择更适合自己的 GPU。
问:如果不开启 DLSS 帧生成功能,RTX 40 系列的性能与 30 系列相比如何?
此图表显示的是已开启 DLSS(如果支持)的情况,但图表中有一些游戏(如“全境封锁 2 [Division 2]”和“刺客信条:英灵殿 [Assassin's Creed Valhalla]”)由于不支持 DLSS,因此您可以看到在这类不支持 DLSS 的游戏中,与 RTX 30 系列 旗舰级 GPU 的性能比较情况。
问:有关视觉效果和游戏的内容非常多,但我对 CUDA 功能更感兴趣。与定位相同的 RTX 30xx 型号相比,核心数量减少了,但支持的功能得到增强。在现有工作流中,RTX 40xx 上的 CUDA Core 核心的速度/性能/效率提升了多少?
CUDA 应用工作流可能比游戏更加多样化。一般而言,核心频率的不断提升使得着色器性能也随之增强,提升幅度从 30% 到 120% 不等。显存访问模式更具挑战性的 CUDA 应用也可以从更大的二级缓存中受益。对于创作者工作流,GeForce RTX 40 系列在离线渲染应用(如 Blender 或 V-Ray)中的速度可提升高达 2 倍,并且与 DLSS 3 搭配使用时,在实时渲染应用(如 Omniverse、虚幻引擎或 Unity)中的速度可提升高达 4 倍。性能更强的同时,其功耗能够与上一代产品相当甚至更低。
问:GeForce RTX 4090、RTX 4080 (16GB) 和 RTX 4080 (12GB) 需要搭配什么类型的电源?
RTX 4090 采用全新的 PCIe 5.0 电源接口,只需一根线缆即可为显卡供电。我们预计将于 10 月推出支持此接口的电源。不过,4090 将附带一个电源转接器,使您可以将电源与主流的 8 针 PCIe 接口配合使用。RTX 4080 使用 PCIe 5.0 电源接口。
RTX 4080 使用 PCIe 5.0 电源接口。它配备了一个支持 PCIe 8 针接口的电源转接器。
此外,目前适用于 RTX 30 系列的 12 针线缆和电源转接器与 RTX 40 系列显卡不兼容。
问:为什么规格表上没有列出 DisplayPort 2.0?
当前的 DisplayPort 1.4 标准能够支持 60Hz 刷新率的 8K 显示器。而且,消费级游戏显示器在相当时期内都不会提供对 DisplayPort 2.0 的支持。
问:谁能解读一下这些性能评测与游戏之间的关联吗? 2 到 4 倍的性能提升看起来近乎史无前例。通常,GPU 的逐代性能提升幅度为 30% 到 50%。评测数据是否可以证明这些显卡能够使游戏性能“至少”翻倍?
RTX 4090 性能之所以能提升高达 2-4 倍,源于软件与硬件增强功能相结合。我们对RTX架构三种不同类型的处理核心都进行了升级,包括着色器核心、RT Core 和 Tensor Core。RTX 4090 与我们全新的 DLSS 3 AI 帧生成技术相结合,与 RTX 3090 Ti 相比,在新的游戏和创意应用中可实现性能翻倍。如果在 GPU 上加载工作负载更大的基于新一代技术的内容,我们会发现性能提升甚至能高达 4 倍。这些并不是最小性能提升,而是您在计算密集度更高的游戏和应用中有望实现的性能提升。
GeForce RTX 40 系列
问:如果 RTX 4080 16 GB 和 12 GB 显卡拥有并不相同的 CUDA Core 核心数量,甚至是不同的芯片,那么它们为何都被称为“RTX 4080”?
RTX 4080 16GB 和 12GB 的命名延续了上一代 两个 RTX 3080 不同版本,乃至之前其它类似产品的命名方式。RTX 4080 提供两种规格,一种具有 16GB 显存,另一种具有 12GB 显存,即一个产品名称,两种规格。
4080 12GB 是一款出色的 GPU,性能超过了上一代旗舰产品 RTX 3090 Ti,凭借 DLSS 3的支持,其性能甚至能够达到 RTX 3080 Ti 性能的 3 倍左右,完全有理由相信它是一款优秀的 80 级 GPU。我们了解许多游戏玩家可能想要一个更高规格的选择,而 RTX 4080 16GB 恰好能提供更大的显存和更高的性能。两个版本的包装、产品细节和销售推广都将会明显不同,因此游戏玩家和创作者可以轻松选择更适合自己的 GPU。
问:如果不开启 DLSS 帧生成功能,RTX 40 系列的性能与 30 系列相比如何?
此图表显示的是已开启 DLSS(如果支持)的情况,但图表中有一些游戏(如“全境封锁 2 [Division 2]”和“刺客信条:英灵殿 [Assassin's Creed Valhalla]”)由于不支持 DLSS,因此您可以看到在这类不支持 DLSS 的游戏中,与 RTX 30 系列 旗舰级 GPU 的性能比较情况。
问:有关视觉效果和游戏的内容非常多,但我对 CUDA 功能更感兴趣。与定位相同的 RTX 30xx 型号相比,核心数量减少了,但支持的功能得到增强。在现有工作流中,RTX 40xx 上的 CUDA Core 核心的速度/性能/效率提升了多少?
CUDA 应用工作流可能比游戏更加多样化。一般而言,核心频率的不断提升使得着色器性能也随之增强,提升幅度从 30% 到 120% 不等。显存访问模式更具挑战性的 CUDA 应用也可以从更大的二级缓存中受益。对于创作者工作流,GeForce RTX 40 系列在离线渲染应用(如 Blender 或 V-Ray)中的速度可提升高达 2 倍,并且与 DLSS 3 搭配使用时,在实时渲染应用(如 Omniverse、虚幻引擎或 Unity)中的速度可提升高达 4 倍。性能更强的同时,其功耗能够与上一代产品相当甚至更低。
问:GeForce RTX 4090、RTX 4080 (16GB) 和 RTX 4080 (12GB) 需要搭配什么类型的电源?
RTX 4090 采用全新的 PCIe 5.0 电源接口,只需一根线缆即可为显卡供电。我们预计将于 10 月推出支持此接口的电源。不过,4090 将附带一个电源转接器,使您可以将电源与主流的 8 针 PCIe 接口配合使用。RTX 4080 使用 PCIe 5.0 电源接口。
RTX 4080 使用 PCIe 5.0 电源接口。它配备了一个支持 PCIe 8 针接口的电源转接器。
此外,目前适用于 RTX 30 系列的 12 针线缆和电源转接器与 RTX 40 系列显卡不兼容。
问:为什么规格表上没有列出 DisplayPort 2.0?
当前的 DisplayPort 1.4 标准能够支持 60Hz 刷新率的 8K 显示器。而且,消费级游戏显示器在相当时期内都不会提供对 DisplayPort 2.0 的支持。
问:谁能解读一下这些性能评测与游戏之间的关联吗? 2 到 4 倍的性能提升看起来近乎史无前例。通常,GPU 的逐代性能提升幅度为 30% 到 50%。评测数据是否可以证明这些显卡能够使游戏性能“至少”翻倍?
RTX 4090 性能之所以能提升高达 2-4 倍,源于软件与硬件增强功能相结合。我们对RTX架构三种不同类型的处理核心都进行了升级,包括着色器核心、RT Core 和 Tensor Core。RTX 4090 与我们全新的 DLSS 3 AI 帧生成技术相结合,与 RTX 3090 Ti 相比,在新的游戏和创意应用中可实现性能翻倍。如果在 GPU 上加载工作负载更大的基于新一代技术的内容,我们会发现性能提升甚至能高达 4 倍。这些并不是最小性能提升,而是您在计算密集度更高的游戏和应用中有望实现的性能提升。