当前位置:首页 > 装机升级 > 显卡 > 评测
AI时代2K高帧游戏新甜品,RTX 4070 SUPER FE首测
  • 2024/1/17 10:22:22
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:电脑报
  • 作者:
【电脑报在线】在RTX 20时代,NVIDIA首次在常规产品线的基础上推出了SUPER系列GPU,包括RTX 2060 SUPER、RTX 2070 SUPER和RTX 2080 SUPER,并获得了玩家一致的好评。首批RTX 20 SUPER GPU被誉为NVIDIA GPU发展史上的经典之作,而SUPER这个称号也成为了高性价比的代名词。虽说在RTX 3

在RTX 20时代,NVIDIA首次在常规产品线的基础上推出了SUPER系列GPU,包括RTX 2060 SUPER、RTX 2070 SUPER和RTX 2080 SUPER,并获得了玩家一致的好评。首批RTX 20 SUPER GPU被誉为NVIDIA GPU发展史上的经典之作,而SUPER这个称号也成为了高性价比的代名词。虽说在RTX 30时代SUPER系列并没有出现,但在前不久的CES2024展会上,NVIDIA终于正式发布了三款RTX 40 SUPER显卡,为这一经典系列带来了新生力量,其中的RTX 4070 SUPER则首先迎来了性能解禁。

2K高帧游戏精准卡位,性价比进一步提升

RTX 4070 SUPER当然也采用了Ada Lovelace架构,在之前测试中,我们已经针对Ada Lovelace架构进行了非常详细的介绍,有兴趣的玩家可以直接查阅我们的文章进行了解,这里就不再赘述(Ada Lovelace架构解析:
https://mp.weixin.qq.com/s/GVBG6oVSIOVeb8B9F0wzWg
)。

玩家最关心的,当然是RTX 4070 SUPER的规格与现有的两款RTX 4070系列GPU相比有何变化。从官方给出的规格来看,RTX 4070 SUPER核心代号为AD104-350,刚好定位在RTX 4070 Ti的AD104-400和RTX 4070的AD104-250之间,且更接近RTX 4070 Ti,由此大家也可以预估到同样源自AD104的它实际性能可能会更接近RTX 4070 Ti。详细规格部分,RTX 4070 SUPER拥有5个GPC和80个光栅单元,与RTX 4070 Ti相同,而TPC数量缩减了两个,流处理器单元也缩减了4个,对应的CUDA数量缩减了512个,因此规模大约相当于RTX 4070 Ti的93%。相对RTX 4070来讲,RTX 4070 SUPER GPU部分的提升就比较明显了,除了加速频率之外,各项规格都有明显增加,如果单从CUDA规模来看,大约提升了22%。显存部分,RTX 4070 SUPER与RTX 4070 Ti、RTX 4070完全相同,都是192bit/12GB GDDR6X,频率也一样。功率部分,官方给出的RTX 4070 SUPER平均游戏功率为200W,位于RTX 4070 Ti与RTX 4070之间,整板功率为220W,更接近RTX 4070,考虑到规格提升的幅度,这个能效比也是非常出色的。

此外,和上代的RTX 3070相比,RTX 4070 SUPER的规格更是飞跃式升级,不但RT Cores和Tensor Cores全面升级,CUDA数量更是暴增,二级缓存甚至增加了11倍,显存容量与频率也突飞猛进,已经不可同日而语。当然,毕竟从RTX 3070到RTX 4070 SUPER已经是迭代升级,有这样的升级幅度也是情理之中。

综合来看,RTX 4070 SUPER的规格超过了RTX 4070 Ti的93%,4899元的首发价却仅为前者的75%,相对RTX 4070的规格大约提升了22%,首发价仅高了2%,可以说性价比确实是非常给力的,看来NVIDIA确实很有决心要再现SUPER系列性价比神话,对于还在使用RTX 3070的老用户来说确实是个升级的好选择。

不光有新GPU,这次NVIDIA也升级了黑科技

2023年里,NVIDIA对DLSS进行了升级,全新的DLSS 3.5不但相对DLSS 3增加了5倍的训练数据量,还带来了光线重建技术,可以进一步改善光追游戏的图像质量,配合超分辨率、深度学习抗锯齿、帧生成、Reflex为玩家带来更高的游戏帧率、更好的视觉效果与更低的操作延迟。同时,DLSS 3.5也能提升实时3D创作的图像质量,提升专业3D创作者的工作效率,例如D5渲染器、Chaos Vantage和NVIDIA Omniverse都将对光线重建技术提供支持。

随着各大厂商都在AI方面开始发力,2024注定是AI生态圈野蛮生长之年,作为AI PC时代开拓者的NVIDIA显然要继续保持领军地位。RTX 40系列GPU通过RT Core、CUDA Core和Tensor Core三大核心实现了全新的Hybrid AI加速,可以提供更加全面的AI加速功能和更高的AI加速效率,从而创造出更多强大的AI应用方式。

在CES2024发布会上,NVIDIA展示了与Convai联合推出的新版NVIDIA Kairos ACE DEMO,同时宣布推出适用于 NVIDIA Audio2Face(A2F)和 NVIDIA Riva自动语音识别(ASR)的ACE Production Microservices。新的AI NPC演示DEMO在之前单个NPC的基础上增加了一名女性NPC,玩家可以通过语言与两名AI NPC进行互动,而AI NPC也会根据玩家的语言给出相应的反应,如此一来可以在未来的游戏中大幅增加游戏的沉浸感与自由度,带给玩家真正属于AI PC时代的游戏体验——当然,NVIDIA ACE也非常适合用来打造数字虚拟人物。

NVIDIA ACE在游戏中工作时,语音转文字、游戏引擎运算、语音与嘴型同步这些环节都是通过本地的RTX GPU来完成的,因此玩家要体验到真正的AI游戏,一块强悍的RTX 40系列GPU是必不可少的。

目前NVIDIA ACE已经开放给游戏与软件开发商使用,除了Convai之外,还有Charisma.AI、Inworld、米哈游、网易游戏、掌趣科技、腾讯游戏、育碧和UneeQ等等知名厂商在积极迎接NVIDIA ACE,也许不久的未来大家就能在热门的游戏大作中与真正的AI NPC互动了。

NVIDIA还更新了RTX REMIX的信息,之前的测试中我们已经介绍过,RTX REMIX可以用来重置经典老游戏,给老游戏加入RTX与AI功能,从而为玩家带来更佳的游戏体验。RTX REMIX将在1月22日开启BETA测试,未来我们将会看到众多经典游戏的RTX重制版,这的确非常值得期待。

AI生产力应用方面,NVIDIA Picasso为iStock生成式AI工具提供了强大的功能,从NVIDIA官方演示视频可以看到,我们可以通过输入提示词的方式在图片中增加物体、重置元素、扩展画面内容,让图片编辑和制造变得非常容易与高效,大大提升了设计师的工作效率。

视频推流应用部分,NVIDIA与Twitch合作推出了基于GeForce GPU强大编码能力的增强版推流工具,可以同时实现五路不同分辨率与帧率推流,并保证最高的推流质量。这对于有多路推流需求的玩家与主播来讲也是非常实用的功能,而且在未来NVIDIA也会和更多的视频网站合作,让更多的用户享受到此项功能。

CES 2024发布会上,NVIDIA还发布了全新的G-SYNC PULSAR技术,此项技术融合了可变刷新率(VRR)和低动态模糊技术(ULMB)的优势,可以大幅提升游戏流畅度和高速运动画面的清晰度,给玩家带来更好的电竞游戏体验。首批采用此技术的ROG Swift PG27系列显示器将会在2024年内上市。

当然,要享受到NVIDIA这些最新的黑科技,一块强力的RTX 40系列GPU是少不了的,接下来就让我们一起走近这款来自NVIDIA的GeForce RTX 4070 SUPER Founders Edition。

GeForce RTX 4070 SUPER Founders Edition图赏

RTX 4070 SUPER FE版从外观设计来看与RTX 4070完全相同,但中框的颜色从RTX 4070 FE的银灰色变成了黑色,如此一来RTX 4060 FE、RTX 4070 FE和RTX 4070 SUPER FE的中框颜色刚好是银白、银灰和黑色从浅到深,代表性能从低到高的排序。此外,我们也注意到显卡上RTX 4070 SUPER的字样从RTX 4070 FE的白字印刷方式改成了阴刻方式,质感更加强烈。此外,RTX 4070 SUPER也采用了16Pin辅助供电接口,视频接口方面也和RTX 4070 FE一样是3个DisplayPort和1个HDMI,散热系统方面,也是和RTX 4070 FE相同的家族式双面风扇设计。那么,接下来就是大家最关心的实战测试环节。

性能实测:2K游戏性能给力,AI出图也是高效利器

测试平台

处理器:Intel Core i9 14900K

内存:芝奇DDR5 6000 16GB×2

主板:华硕ROG MAXIMUS Z790 HERO

显卡:GeForce RTX 4070 SUPER Founders Edition

GeForce RTX 4070 Ti Founders Edition

GeForce RTX 4070 Founders Edition

硬盘:WD_BLACK SN850X 2TB

电源:华硕ROG雷神1000W

操作系统:Windows 11专业版22H2

基准性能测试

首先是基准性能测试。在针对DX11的FireStrike系列测试中,RTX 4070 SUPER领先RTX 4070的幅度十分明显,分辨率越高,优势越大,4K下甚至领先23%之多;而相对RTX 4070 Ti来看,FHD下达到了它96%的性能,4K下也有它92%的水平。在针对DX12的TimeSpy系列测试中,RTX 4070 SUPER领先RTX 4070大约17%~18%,达到了RTX 4070 Ti大约91%的性能。DXR和Port Royal光追性能与DLSS测试部分的情况也差不多是如此,RTX 4070 SUPER综合领先RTX 4070 大约17%~21%,达到RTX 4070 Ti大约91%~94%的性能。

总的来说,RTX 4070 SUPER的性能非常接近RTX 4070 Ti,而相对RTX 4070的提升则非常明显。如果和RTX 3070比较的话,RTX 4070 SUPER在DX11和DX12项目中都做到了平均50%的综合性能提升,而在光追项目中最高领先幅度更是高达91%,开启DLSS 3模式下直接领先一倍,这个提升幅度完全有理由让还在使用不支持DLSS 3帧生成的RTX 3070老玩家升级了。

光栅化游戏性能

RTX 4070 SUPER的官方定位是2K高帧率游戏利器,从光栅化游戏测试的情况来看,它确实可以在2K极限画质下实现极高的流畅度,多数游戏都达到了一百多甚至两百多的帧率,体验相当出色。2K分辨率下,RTX 4070 SUPER平均领先RTX 4070大约17%,达到RTX 4070 Ti大约92%的水平;4K分辨率下RTX 4070 SUPER平均领先RTX 4070 大约18%,达到RTX 4070 Ti大约91%的水平。虽说RTX 4070 SUPER定位2K高帧率游戏应用,但我们可以看到在4K分辨率极限画质下,它也可以让大部分游戏大作保持平均60fps以上的流畅帧率。总的来说RTX 4070 SUPER的光栅化游戏性能表现与3DMark基准测试的情况比较符合,非常接近RTX 4070 Ti的水平,领先RTX 4070的幅度十分明显。

光追与DLSS游戏性能

光追和DLSS显然是RTX GPU的绝技,在DLSS的支持下,即便是在游戏大作中打开最高画质下的光追特效,RTX 4070 SUPER也能提供相当流畅的帧率,2K分辨率下轻松HOLD住所有光追游戏大作,4K分辨率下也能让大部分光追游戏达到流畅运行的水平。从实测来看,RTX 4070 SUPER在2K和4K分辨率下都平均领先了RTX 4070大约15%,达到了RTX 4070 Ti的90%~92%。

▲在《心灵杀手2》中开启DLSS 3.5新增的光线重建技术之后,水面反光的细节度明显增加

包含帧生成功能的DLSS 3是让RTX 4070 SUPER性能飙升的超强黑科技,目前已经有很多游戏大作都添加了对DLSS 3的支持,而支持DLSS 3.5(新增光线重建技术)的游戏大作数量也在逐渐增加中。从实测来看,和2K极限画质未开DLSS相比,开启DLSS 3之后RTX 4070 SUPER的帧率提升幅度非常大,在《心灵杀手2》中甚至提升了166%之多,在《赛博朋克2077》中也提升了149%,其他游戏也有33%到91%的提升,可见DLSS 3在提升游戏帧率方面的效果非常给力,相当于让显卡性能免费提升了几个档次。此外,光线重构也带来了更好的画面效果,可以看到,在《心灵杀手2》中开启光线重建技术之后,水面反光的细节度明显增加。

▲开启DLSS 3.5之后可以看到横梁上已经几乎没有噪点

▲开启DLSS 3.5之后桌面上已经看不到噪点

其实DLSS 3.5除了可以在游戏中大显威力之外,在3D设计等生产力软件中也能大幅提升效率和画面质量。例如D5渲染器就提供了对DLSS 3.5的支持,包括了光线重建、超分辨率缩放和帧生成功能。从实测来看,在开启DLSS 3.5之后,RTX 4070 SUPER的效率提升幅度高达375%,同时渲染出来的画面噪点明显降低,因此强烈推荐设计师用户打开对DLSS 3.5的支持,享受最完美的渲染效率与效果。

DLSS 3(包含Reflex)除了可以大幅提升游戏帧率,还可以降低帧延迟和操作延迟,提升玩家操控的响应速度。从FrameView监测的PCL延迟来看,开启DLSS 3后,绝大部分游戏的延迟都大幅下降,流畅度明显增加,效果非常显著。

总的来说,从整个游戏实测的汇总情况来看,RTX 4070 SUPER的表现更接近RTX 4070 Ti,差距仅有几个百分点,而相对RTX 4070来讲,RTX 4070 SUPER的游戏性能提升非常明显,大约有10%~20%的幅度。考虑到RTX 4070 SUPER首发价仅比RTX 4070高了100元,加价幅度仅有2%,因此RTX 4070 SUPER的性价比可谓是暴涨。

此外,大家也可以看到,RTX 4070 SUPER在2K极限画质设置下可以轻松HOLD住主流光追游戏大作,加上DLSS之后更是可以达到极高的游戏帧率,确实称得上是2K高帧率游戏利器。

当然,就算是把分辨率提升到4K,RTX 4070 SUPER也能搞定大部分游戏大作,达到平均60fps以上的流畅帧率,酌情降低一点画质设定的话,达到百帧以上也是完全可以的。因此,对于中高端游戏玩家来讲,RTX 4070 SUPER确实算得上是性价比极高的选择。

而对于RTX 3070老用户来讲,RTX 4070 SUPER不但带来了大约50%的综合性能提升,还提供了RTX 3070没有的DLSS 3帧生成功能,在支持DLSS 3的游戏中提升幅度可以实现翻倍,确实是非常值得升级的选择。

视频/图片编辑与3D渲染

RTX 4070 SUPER拥有多达12GB显存,还有NVIDIA STUDIO加持,很显然除了玩游戏给力之外也是一款能够大幅提升工作效率的生产力工具。从测试来看,在Blender、V-Ray和Octane的3D渲染输出项目中,RTX 4070 SUPER相对RTX 4070的领先幅度大约为11%~21%,比较符合基准性能的差异。在达芬奇Prores422HQ视频编码测试中,RTX 4070 SUPER与RTX 4070表现几乎相同,毕竟它们拥有相同的视频编解码器版本与数量。PugetBench for Premiere Pro 2024视频剪辑综合测试中,3款RTX 4070系列GPU总分表现比较接近,RTX 4070 SUPER领先RTX 4070大约3%。PugetBench for Photoshop 2024综合测试三款GPU的总分表现也比较接近,RTX 4070 SUPER同样平均领先RTX 4070大约3%。

综合来看,对于有3D设计、视频/图片编辑的专业用户来讲,RTX 4070 SUPER可以提供比RTX 4070更高的工作效率,特别是在3D设计类应用中,优势更加明显。

AIGC性能测试

▲在Stable Diffusion中使用NVIDIA TensorRT优化的Unet以大幅提升RTX 40 GPU的出图效率

使用GPU来实现本地AIGC可以说是当下极为火热的应用,特别是Stable Diffusion出图,已经算得上是非常普及的全民级AI应用了。当然,NVIDIA GPU一直以来对Stable Diffusion的支持都非常到位,不但兼容性完美,还可以提供当下遥遥领先的计算性能。现在NVIDIA还推出了NVIDIA TensorRT,可以让NVIDIA GPU更高效地运行已经训练好的神经网络。从NVIDIA给出的官方参考数据来看,通过TensorRT优化,RTX 40系列GPU的Stable Diffusion出图效率提升幅度甚至最高可以接近两倍。

RTX 4070 SUPER拥有12GB大容量显存,算力也相当出色,确实非常适合用来完成Stable Diffusion本地出图任务。这里我们选用Stable Diffusion Automatic1111 WebUI来对RTX 4070 SUPER的出图效率进行测试,并同时考查在使用NVIDIA TensorRT优化之后,出图效率会有多大幅度的提升。

首先是Stable Diffusion的基准测试,使用了NVIDIA官方推荐的标准设置:采样方式为Euler a、采样步数为50、CFG Scale为7.5、每批次出图数为2、批次为10,最后统计每分钟出图数量。从表中可以看到,RTX 4070 SUPER每分钟出图数量达到10.43张,非常接近RTX 4070 Ti的10.71张,比RTX 4070则快了约15%。当然,要是和Core i9 13900K相比的话,RTX 4070 SUPER出图效率是它的133倍。

接下来我们使用NVIDIA TensorRT分别对Stable Diffusion XL和Stable Diffusion V1.5的模型进行了优化,由此来对比优化前后RTX 4070 SUPER出图效率的变化。在使用Stable Diffusion V1.5的模型时,我们分别选用了512×512、768×768的出图分辨率,而在使用Stable Diffusion XL模型时选用了1024×1024的出图分辨率(与训练模型的图片分辨率相同),考虑到RTX 4070 SUPER的12GB显存容量,这个出图分辨率也是NVIDIA推荐的尺寸。其他参数方面,采样方式为Euler a、采样步数为50、CFG Scale为7、每批次出图数为1、批次为10。

在使用NVIDIA TensorRT优化后,RTX 4070 SUPER在Stable Diffusion V1.5的512×512出图测试中提升幅度超过116%,768×768出图测试中提升幅度接近170%。Stable Diffusion XL出图测试中,提升幅度也高达146%,可见NVIDIA TensorRT效果相当给力,非常值得使用。

从Stable Diffusion测试可以看到,RTX 4070 SUPER可以提供相当不错的AI计算效率,依靠12GB大显存也可以轻松完成Stable Diffusion XL的1024×1024高分辨率出图,并且还可以通过NVIDIA TensorRT进一步巨幅提升出图效率,可谓是当下性价比极高的AIGC工作利器。

当然,众所周知,NVIDIA在AIGC领域保持着绝对的领导者地位,生态环境无可匹敌,“玩AI必须选择NVIDIA GPU”已经是业界和用户的共识。而NVIDIA为RTX 4070 SUPER也注入了强大的AI计算能力,可以轻松应对所有支持GPU AI加速的应用(包括AI图片处理、AI视频制作、AI文字工具,以及各种支持AI功能的专业设计工具),为设计师用户、企业办公用户提供了高效且高性价比的解决方案。

游戏功率实测

从前面的规格参数可以看到,RTX 4070 SUPER的平均游戏功率可以控制在200W的水平。从我们用NVIDIA FrameView工具监测的情况来看,5款游戏大作中RTX 4070 SUPER的平均游戏功率最高211W,最低166W,综合平均下来为195.4W,差不多等于用RTX 3060的功率实现了与RTX 3090相当的性能,不得不说RTX 40系GPU的能效比表现实在是太优秀了。

总结:SUPER经典+SUPER性价比,2K高帧游戏上佳之选

最后来简单总结一下。从GPU规格来看,RTX 4070 SUPER非常接近RTX 4070 Ti,相对RTX 4070有着显著的升级,而从各种游戏与3D渲染类生产力工具的性能对比来看,RTX 4070 SUPER也确实非常接近RTX 4070 Ti,仅有几个百分点的差距,而相对RTX 4070的升级幅度则达到了10%~20%,首发价仅比RTX 4070高出100元,性价比算得上是暴增了。从绝对性能来看,RTX 4070 SUPER确实可以在2K极限画质下轻松搞定各种光追游戏大作,提供足够流畅的低延迟高帧率体验,甚至在4K分辨率下也能搞定大部分游戏,特别适合中高端游戏玩家选择。

此外,DLSS 3/3.5也为RTX 4070 SUPER带来了免费的巨幅游戏帧率与画质提升,像是《赛博朋克2077》和《心灵杀手2》的帧率提升甚至分别高达149%和166%。而DLSS 3.5新增的光线重构技术更是大幅提升了画面渲染精度,为玩家带来了更出色的视觉体验。目前支持DLSS 3的游戏大作已经非常多,而未来的游戏大作也普遍会提供对DLSS 3/3.5的支持,这也使得RTX 4070 SUPER的购买价值进一步剧增。此外,DLSS 3/3.5不光在游戏中大展拳脚,很多3D设计工具软件也提供了对它的支持,例如D5渲染器,在开启DLSS 3.5之后,不但效率大增,渲染画面的降噪效果也提升明显。未来也会有更多的生产力工具提供对DLSS 3.5的支持,因此对于设计师用户来讲,拥有RTX 40系列GPU就是享受这些先进功能、提升工作效率与质量的前提。

专业设计方面,RTX 4070 SUPER本身就具备十分接近RTX 4070 Ti的计算能力,而12GB GDDR6X大显存也在各种生产力工具中占据优势。更重要的是,各种主流生产力工具都针对NVIDIA GPU的黑科技进行了优化,CUDA生态环境无与伦比,这也让RTX 4070 SUPER成为了设计师用户的高性价比之选。此外,在AIGC方面,NVIDIA TensorRT巨幅提升了RTX 40 GPU在Stable Diffusion中的出图速度,让选择RTX 4070 SUPER来完成AI出图任务的用户获得了免费的效率提升,进一步巩固了RTX 40 GPU作为首选AI加速工具的霸主地位。

总的来说,RTX 4070 SUPER作为新一代SUPER系列GPU的先锋,确实重现了当年SUPER系列GPU的经典,也拥有SUPER级别的超高性价比,非常值得中高端游戏玩家与AI用户选择。

本文出自2024-01-15出版的《电脑报》2024年第3期 E.硬件DIY
(网站编辑:pcw2013)