您当前的位置:首页 > 起名 > 姓名配对

甜甜圈测试(甜甜圈测试软件叫什么)

时间:2024-01-25 11:37:00 作者:隐身守侯 来源:网友投稿

本文目录一览:

不服就来比一比,显卡常用测试软件使用教程及下载地址

很多人对电脑硬件跑分的高低十分在意,而且沉迷其中,乐此不疲。特别是显卡跑分,总要跟群友们一较高下,今天就以我手中这片影驰 RTX 2070 星曜显卡,带来几款常用的显卡测试软件介绍,以及简单的使用教程和下载地址。

1、 显卡基本信息检测工具-《GPU-Z》

GPU-Z是一款十分专业的显卡信息检索软件,他可以显示包括显卡型号,显存型号,显卡品牌,基本规格,动态频率,实时温度等重要信息。

他的界面清晰,一目了然,更新频率十分频繁,对新显卡的支持十分迅速,且体积小,不占用系统空间。唯一的缺点是界面为英文,如果你更希望能有中文注释,没关系,将你的鼠标移动到你想要了解的信息栏,会有中文注释弹出来。

一般我们在运行其他测试软件的时候会同步开启GPU-Z,以实时检测显卡动态。例如我们在跑温度压力测试时,同步检测显卡的动态加速频率、功耗以及风扇转速,就可以对显卡的满载能力做一个大致的估量。Sensors页面的每一项数据可以通过鼠标点击,切换显示最大值、最小值、当前值等信息。

不同品牌的同一级别显卡,最大区分在于加速频率,也就是右下角的Boost频率。但这只是一个出厂预设值,可以通过超频软件来进行提升,前提是要能够保证显卡长时间稳定运行。

GPU-Z官方下载地址:https://wwwpowerup/download/techpowerup-gpu-z/

2、 显卡温度压力测试-《Furmark》

也就是我们常说的甜甜圈软件,他的运行界面类似一个圆圈在左右晃动。

运行温度压力测试,我们一般直接点击【GPU Stress test】按钮即可,等温度曲线变为一条没有波动的直线,此时的温度就是显卡的满载温度。图示为我自用的RTX 2070 星曜显卡,左侧最低温为待机温度24℃,最高温度64℃为满载温度。

其中分辨率的设置不会影响温度,部分显卡开启和关闭抗锯齿会有较大温差,我们一般测试默认关闭抗锯齿。

另外温度测试受室温和机箱风道影响很大。如果你的显卡跑满载超过80℃就要考虑提升机箱风道或者装一台空调了。

是不是温度越低就越好呢,也不尽然。显卡一般设定了温度墙和功耗墙,当显卡温度过高或负载过大时,会自动降低频率,来降低温度。也就是为什么我们要在测试甜甜圈的同时开启GPU-Z,以检测显卡的动态频率。我们可以简单理解,在同一级别的显卡满载温度测试,加速频率越高同时温度越低越好。

另外一个需要注意的点是显卡风扇的转速,满载会让显卡风扇自动进入高转速状态,一般这还不是显卡的最高转速,需要通过各家的显卡软件进行拉满。当显卡风扇转速超过2000转时,会有明显的噪音。所以我们评价一片显卡,要从满载温度、满载频率、满载噪音等多个维度进行考量。

Furmark官方下载地址:https://geeks3d/furmark/

3、 最简单的跑分软件-《鲁大师》

既然说到显卡跑分,最不能略过的就是鲁大师了,他已经成为了很多人比较显卡的一个重要标准。但随着鲁大师软件本身的更新和显卡驱动的更新,每一段时期内的显卡跑分都会有很大变化。而且鲁大师本身的测试不够严谨,更改分辨率或篡改后台都能够得到不一样的结果,这也是别人戏称他是“鲁大娘”或“鲁大爷”的原因。

在鲁大师的性能测试界面,点击开始评测就可以对电脑的CPU、显卡、内存、硬盘进行逐个的测试,然后给出一个数字分数,并且有一行小字告诉你击败了全国多少的用户。可以说就是这样一行小字才使得鲁大师成为了“最知名”的测试软件。

如果你想节约时间,只跑显卡分,去掉另外三项的勾就可以了。图中我的影驰 RTX 2070星曜跑出了24万多分,快看看你的显卡能跑多少分吧。

鲁大师另外还可以检测你的电脑硬件型号,自动下载驱动,对于新手来说真的是太贴心了。

鲁大师官方下载地址:https://www.ludashi/

4、 史上最难单机游戏-《3DMark》

3DMark是目前世界公认最专业的显卡测试软件,跑分成绩可以上传至UL官网,单项跑分前十还可以位列名人堂榜单供后来者超越。3DMark的测试项目同时也是显卡超频世界纪录的比赛项目,其专业程度可见一斑。

3DMark需要付费购买,但你如果只是想要测试一下显卡的稳定性,从Steam也可以下载试用版,免费体验Time Spy测试项目。

除此之外,3DMark还有包括Time Spy Extreme、Port Royal、Fire Strike Ultra、Fire Strike Extreme、Fire Strike等多个测试项目,分别针对不同的场景进行基准测试,每一项测试可自定义参数,但一般我们是直接点击【运行】,进行预设测试。

3DMark的测试结果包含总分和显卡分、CPU分数,一般我们只比较显卡分。另外,3DMark还可以进行显卡压力测试,以测试显卡在长时间满载中的散热能力。

3DMark官方下载地址:/d/file/gt/2023-09/zvivl2jwj2r.zip 游戏帧数记录-《Fraps》

跑分只能知道一个分数,但游戏里面显卡能跑多少帧才是最重要的,Fraps软件就可以显示显卡实时帧数,并同步将这些数据记录下来。只要你打开Fraps软件,再进入游戏,就可以看到左上角黄色的帧数显示。

Fraps的设置界面也十分简单,在FPS选项中可更改记录保存地址,开始记录快捷键,需要记录的数据、时长,以及帧数显示位置。

完成记录后,Fraps会自动生成相应的数据表格,然后将数据转化为图形,就是我们在评测网站见到的柱形图了。

除了帧数记录,Fraps还可以录制视频,游戏截图。另一个需要注意的要点,Fraps软件对DX11的游戏支持十分友好,但在DX12游戏中,并不能显示帧数,所以DX12需要借助下一个软件来监控帧数。

Fraps官方下载地址:https://www.fraps/download.php

6、微星小飞机阿福巴特-《Afterburner》

虽然这是微星推出的一款显卡超频软件,但其实他应用更加广泛的是硬件监控功能,相比于Fraps的单项FPS监控,小飞机还可以监控显卡占用、功耗、转速、温度等多达数十组数据,并且支持DX12游戏。

小飞机的监控数据同样支持本地保存,软件会生成一张波形图,来体现各个配件的表现。如果你只需要其中某几项数据,那么可能麻烦一点,需要选择数据源文件,使用EXCEL格式打开来读取。

小飞机软件的使用稍微复杂一些,需要配合RivaRuner Statistics Server软件一起使用,这是小飞机自带的一个组件,不需要另外下载。

首先在RivaRuner Statistics Server中将监控打开,也就是On-Screen Display support选项调整至ON。其他选项是调整数据大小、位置、文本颜色、描边、底色等参数,一般默认即可。

接着在Afterburner主界面点击齿轮进入设置界面,在图表下拉框中勾选需要展示的参数,然后再勾选【在OSD上显示】,勾选【Override group name】,然后再文本框中输入你想要更改的命名,点击应用和确定就可以了。

如果你需要保存监控数据,那么勾选【日志文件保存到】,然后修改路径或使用默认路径即可,此外还可以设置记录开始和结束的快捷键,也就是底部的【Begin logging】和【End logging】项目。

微星小飞机Afterburner软件还有十分丰富的功能,有兴趣的可以下载试试,不论是N卡还是A卡用户,都可以免费使用。

Afterburner下载地址:https://download-cn.msi/uti_exe/vga/MSIAfterburnerSetup.zip

7、 后起之秀-《游戏加加》

说他是显卡测试软件其实不太恰当,我认为他应该属于游戏辅助软件一类。早期游戏加加也只能监控游戏帧数、硬件占用情况等简单功能,这两年增加了许多功能,例如画质补丁、录像截图、游戏跑分等。

图示中的顶部一栏即为游戏加加的监控栏,游戏内可以按ctrl+tab呼出设置界面,调整需要监控的数据和文本大小、位置等。

游戏加加的测试项目比较简单,选择一款游戏,点击开始测试,一顿操作以后,会给你的电脑评估一个性能区间,也就是告诉你玩这款游戏大概是什么水平。

另一个比较实用的功能是游戏加加可以在你结束游戏以后,自动生成一段波形图,其中就包含FPS和显卡占用、温度等。

游戏加加下载地址:/d/file/gt/2023-09/iivqosbmtoq 软件跑分只能作为整机性能的参考,不能盲目追求高分数来选购配件,还是要从实际需求出发。

2、 过度压榨显卡性能来追求高跑分,可能导致显卡花屏,新手不推荐盲目超频。

3、 部分游戏自带benchmark测试动画,可以不借助软件监控帧数,例如古墓丽影、荒野大镖客2、最终幻想15、幽灵行动荒野等。

4、 除去以上介绍的7款软件,专业的显卡测试还包括功耗测试和噪音测试等需要额外借助设备的内容,这里就不做讲解。

显卡降价矿难了!分享几个检测矿卡的实用软件

基本上可以确定现在显卡矿难了,很多超级便宜的显卡满天飞,你会不会担心现在入手二手显卡买到矿卡呢?

不要慌,浩南给你们分享几个软件进行测试一下,大概率能判断出是不是矿卡!

1、GPU-Z

这是老朋友软件了,通过程序可以查看SP管线数量,核心核显频率,以及TDP范围,我们可以运行游戏测试各个数据的峰值表现,尤其观察功耗和频率!

矿卡一般温度偏高,功耗偏大,频率有所降低,还有就是噪音偏大。

2、3D Mark

主要测试稳定性,如果是矿卡,大多数会有暗病,很难顺利通过测试,再进行DX12 20轮循环测试,可以看出显卡的体质,如果是优秀的分数会在99%以上,低于97%的体质表示不合格。

还可以测试性能分数,整体数据会比娱乐大师准一点,可以看出在4K分辨率以及开了DLSS的具体帧率情况,游戏测试的基本软件。

3、Furmark

俗称甜甜圈,可以测试显卡的极限温度以及稳定性,如果没有出现闪屏,或者黑屏以及花屏等情况,那么通过这项测试。

以上三款软件如果顺利通过,那么至少说明你的显卡体质是稳定的,大概率情况下不是矿卡,或者长期挖矿的显卡。

不过现在凡事无绝对,很多矿卡已经被翻新成了有质保的显卡出售,官方都睁一只眼闭一只眼,最好的建议其实还是去购买新上市的显卡,RTX30系列显卡买到矿卡的风险很大。

光追显卡要有光,耕升GeForce RTX 4080 16GB炫光SOC显卡评测

1引言/规格/外观赏析

引言

RTX4090早在上个月就亮相了,极致的性能表现不负卡皇之名,然而过万的售价让不少玩家望而却步,这不RTX4080就到来了,全新AdaLovelace架构以及换用TCN4工艺让这一代RTX4080显卡性能获得飞跃,不少玩家也好奇RTX4080究竟如何。

早前我们测试了耕升GeForceRTX4090炫光OC,不俗的性能表现让人眼前一亮,这次我们拿到了耕升GeForceRTX408016GB炫光SOC,依旧不负众望,下面就让我们通过这张显卡,一起了解RTX4080的表现吧。

耕升GeForceRTX408016GB炫光SOC(简称:“耕升RTX4080炫光SOC”)

规格对比

在开始之前,先了解一下本次的主角RTX4080,其采用的是AD103-300核心,TC4N工艺制造,芯片面积为379平方毫米,晶体管密度达到了459亿,晶体管数量相比较于上一代产品提升明显,近乎翻倍,而这一代的核心还进一步提升了频率,因此能带来更好的性能表现。

其他参数方面,RTX4080RTX4080标配9728个CUDA,128个第三代RTCores,512个第四代TensorCores,并且用上了16GB的GDDR6X显存,大显存配合性能上的提升更可以为游戏以及创作者带来更好的使用体验。

而目前RTX4080显卡配备的AD103-300核心并不是完整的AD103核心,完整的AD103核心应该包括7个GPC(图形处理集群)、40个TPC(纹理处理集群)、80个(流式多处理器)以及一个带有8个32Bit显存控制器的256Bit显存带宽。因此笔者猜测,RTX4080或许不是AD103核心下的终极产物,后续应该还会推出完整AD103核心的RTX4080Ti。

再看看下方的RTX4080的核心结构图,和完整版本的AD103核心对比起来就很容易看出差别,RTX4080核心代号为AD103-300,其拥有4个完整规格的GPC(图形处理集群,每个内建6个TPC),与3个非完整的GPC(两个内建5个TPC,一个内建4个TPC),共组成38个TPC,单元则剩下76个,显存位宽还是完整的256Bit。

但是RTX4080上的AD103-300核心在编解码器上砍了一刀,不得不说老黄的刀法精准,编解码器数量直接砍半,与RTX4090同等规格,仅保留了两个NVENC编码器和一个NVDEC解码器,因此完整版的AD103核心应该会有更快的视频编解码速度,不过之前测试过RTX4090,编解码速度相比上一代有着近乎翻倍的提升,想必RTX4080也有不错的表现。

外观赏析:耕升GeForce RTX 4080 16GB 炫光 SOC

不得不说耕升RTX4080炫光SOC的包装盒是真的大,甚至比一些RTX4090的包装盒还大,足见其份量之重。包装盒的正面是大大的X型标志,与耕升X系列不谋而合,多重色彩的搭配一眼就抓住了玩家的视线,给人不一样的神秘视觉效果。

包装盒背面则是耕升RTX4080炫光SOC全新升级的技术及品牌理念,如“炫光ARGB、升级优化的炫风之刃扇叶等。

包装内除了显卡本体外,还附赠了3*8Pin转16Pin的转换头,一个ARGB显卡支架,以及相应的灯光同步线。

耕升RTX4080炫光SOC显卡正面依旧采用黑色钢琴面外壳设计,光线反射下还能呈现奇幻光影,颇具科幻感,与现在那些棱角分明的显卡完全不同,耕升这张RTX4080显卡有着简约而又神秘的感觉。

简约的外观下是三把经过升级优化的“炫风之刃风扇”,耕升RTX4080炫光SOC使用第二代“炫之黑曜石”散热系统,左右两侧的风扇为102mm,中间为92mm,并且扇叶经过改良,能够大幅提升进风量,有效降低显卡温度。

这一代显卡的重量大家都知道,为了增强显卡强度,耕升RTX4080炫光SOC配备了金属背板,背板上印有“GeForceRTX”的字样和NVIDIA核心AIC之一“耕升”的英文名称。

金属背板的右侧是镂空的窗口设计,隐约可以看见内部的散热鳍片,增加内部空气对流,散热风扇能够快速带离内部热量,降低显卡温度。

显卡的顶部是GEFORCERTX字样,一整排的出风口横跨整个显卡顶部和底部,加速热量排出。

耕升RTX4080炫光SOC用上了最新的12VHPWR供电接口,用来带320W的TGP可以说是绰绰有余了。供电接口的下方是配备有品牌logo的灯带,通电后可与显卡同步RGB显示。

底部为显卡金手指,接口为标准的PCIe4.0x16,在使用前一定要在主板打开ResizableBAR功能,这张显卡的性能才能完全释放。

比起其他RTX4080显卡,耕升RTX4080炫光SOC更为“轻薄”,是一张三槽显卡,配备了3个DP1.4接口和1个HDMI2.1接口,支持最高8K输出显示。

如果你以为这张显卡的外观平平淡淡那你就太天真了,这张显卡在你看不见的地方藏了大面积的RGB灯效,顶部的Logo灯带能够与主机硬件实现神光同步,配合烤漆钢琴面的外壳,别有一番韵味。

正面纯黑色的显卡外壳平平无奇,其实它是半透明的塑胶材质制作,底下塞满了ARGB灯珠,在点亮后能够给玩家带来一场炫光RGB盛宴。

外壳表面采用极具赛博朋克风的PCB板花纹设计,通电后可以看到多如繁星的电路纹路,大面积炫光RGB充满未来科幻感,不得不说耕升真是玩灯的一把好手。

并且上面这些RGB灯效可以通过耕升全新的控制中心GW-SOUL进行自定义,可玩性非常高。它不仅可以实时侦测显卡频率、温度、风扇转速等工作状况,还有一键超频功能,方便小白用户操作。

2耕升GeForce RTX 4080 16GB 炫光 SOC显卡拆解

显卡拆解:耕升GeForce RTX 4080 16GB 炫光 SOC

看完外在,现在该来看内在了,这款显卡的拆解十分简单,拧下金属背板的螺丝已经可以看到显卡PCB背部和硕大的散热器。

X型的散热鳍片固定器映入眼帘,在这背后就是这款显卡的核心芯片——基于TC4N工艺定制的AD103-300。

卸下固定器上的四颗螺丝就可分离PCB与散热器了,PCB是类公版的方案,采用12层PCB设计,从PCB可以清楚的看到耕升RTX4080炫光SOC为越肩设计,比一般的显卡都要再高一些,不过PCB上的接口、供电、核心、显存,以及辅助供电位置都相当的合理且规正。

在PCB正中央我们可以看到耕升RTX4080炫光SOC的AD-103-300核心,相较于公版,它的BOOST频率更高,达到了2625MHz。

核心的四周便是8颗美光的GDDR6X显存,型号为2PU47D8BZF,单颗显存容量2GB,8颗组成16GB,显存位宽为256Bit,速度达到了21Gbps。

既然是RTX4080的规格,供电也自然不差,供电模组被安排在PCB的两侧,采用16相核心供电+3相显存供电。

每相供电都采用独立的DrMos芯片,封装型号为BLN3,实际应为AOS的AOZ5311NQI-03,持续输出电流为55A。

供电控制芯片则安排了uP9512R、uP9529Q以及uS5650Q,其中uP9512R与uP9529Q共同管理核心供电,可以做精细化的供电管理,而uS5650Q则是主要负责显存供电部分。

另外在PCB的右上角还可以看到全新的12VHPWR供电接口,相比以往的8Pin接口,占用的地方要少很多。

看完了PCB电路设计,下面来看看耕升全新设计的第二代“炫之黑曜石”散热器。

耕升RTX4080炫光SOC用的是4090同款散热器,解热能力MAX,这一代显卡散热器可以说是超规格了,不仅能够给GPU散热,还为显存、电感以及MOS管等进行散热。显存供电部分均配备了高系数的导热垫辅助散热,GPU核心也抹上了厚厚的硅脂,显存位置更是紧贴真空腔均热板,难怪都说这一代显卡都“冻感冒”了。

第二代“炫之黑曜石”散热器用的是两段式的散热模块,两边均升级了特大面积的散热鳍片。散热鳍片的底下,8根镀镍设计加强抗氧化能力的热管穿梭而过,超高效的散热效能助力显卡超性能发挥。

单就这个散热配置看着就不会差,并且背板末端部分还是镂空设计,搭配散热风扇,还能进一步降低显卡温度。

单有散热器可不够,第二代“炫之黑曜石”散热系统还升级优化了“炫风之刃”散热风扇,2个102mm和1个92mm风扇组保证了散热性能。

经过特殊优化的扇叶还能够进一步提升风流量,降低风扇噪音。

3测试平台/理论性能测试

测试平台介绍

在这次的测试中,我们依旧把配置拉满了,CPU用的是Inteli9-13900K,主板为ROGMAXIMUSZ790HERO,内存插满,直接上金士顿的64GBDDR5-6000,旗舰级配置才能让耕升RTX4080炫光SOC完全释放性能。

高端显卡自然要有顶级的显示器来搭配,这里我们用的是爱攻&保时捷联名设计的AGONPD32M,4K144Hz和MiniLED背光技术加持下,游戏赛场上的瞬息万变都能轻易察觉,电竞游戏时纵享丝滑画面,用来搭配这张耕升RTX4080炫光SOC再适合不过了。

硬盘则是金士顿NV22TB版本,号称Gen4入门级固态硬盘的性价比之选,铠侠3DTLC闪存颗粒,3500MB/s和2800MB/s的标称读写速度,相对于入门级的PCIe3.0产品也近乎实现了性能翻倍,扎实的用料、稳定的性能卓越的性价比让它广受消费者喜爱。

上机测试前,先打开GPU-Z确认显卡是否正常识别,另外通过该软件还可以看到耕升RTX4080炫光SOC的基准频率为2205MHz,Boost频率可以达到2625MHz,高于FE公版的2505MHz,这个提升是真的猛。并且可以看到此时主板的ResizableBAR功能已开启,显卡能够做大限度的发挥出其全部性能。

另外还可以看到在功耗与温度设定上,耕升RTX4080炫光SOC的TGP设定是320W,与公版一致,允许最高限度420W;温度控制的上限为84℃,不过可向上调整至88℃,想必这张卡还有不小的超频空间。

理论性能测试

首先是理论性能测试,为了更好的展现耕升RTX4080炫光SOC的性能,我们也加上了前代卡皇RTX3090Ti进行对比。

在3DMark测试中,耕升RTX4080炫光SOC的表现喜人,相比前代RTX3080Ti提升了35%,即使是面对RTX3090Ti也有20%以上的性能提升。与RTX4090相比,耕升RTX4080炫光SOC基本达到了其70%以上的性能,整体性能符合预期。

耕升RTX4080炫光SOC在光追和DLSS测试项目中,性能几乎是RTX3080Ti的1.4倍,可见新架构和新工艺带来的性能提升有多明显。

在AIDA64GPGPU的理论性能测试中,耕升RTX4080炫光SOC的领先幅度进一步提升,无论是跟RTX3080Ti比还是跟RTX3090Ti比,它的性能都高出40%左右。大家最关注的哈希算力方面则与3080Ti持平,终于不用担心又是一张空气卡了。

4游戏性能测试

游戏性能测试

耕升RTX4080炫光SOC的理论性能相比RTX3080Ti提升已经去到30%了,那玩家更关注的游戏性能究竟如何,我们在不同分辨率下选取了多款主流热门的3A游戏进行实测。

1080P分辨率对耕升RTX4080炫光SOC可以说是毫无难度,上一代的RTX3080Ti都能流畅游玩,更不用说这一代了,整体性能领先27%以上。

随着分辨率的提升,新显卡的优势逐渐明显,耕升RTX4080炫光SOC逐渐与RTX3080Ti拉开差距,游戏帧数基本都在120FPS以上,像优化好的《古墓丽影:暗影》都快到300FPS以上了。

4K游戏可以说是耕升RTX4080炫光SOC的主场,实测大多数游戏都能跑到100FPS左右。即使是有“显卡杀手”之称的《赛博朋克2077》,在开启超级光追的情况下,耕升RTX4080炫光SOC开启DLSS后也能跑出87FPS,相比上一代的RTX3080Ti的60FPS勉强能玩,提升可谓相当明显。

那么在8K游戏方面,耕升RTX4080炫光SOC的表现如何?经过实测,在8K分辨率下,部分游戏即使在超高画质的情况下能够跑到60FPS以上的成绩,像《古墓丽影:暗影》在开启DLSS超级性能的情况下甚至能有过百的帧率。热门竞速游戏《地平线5》中,这张显卡也能有71FPS流畅运行,而前代的RTX3080Ti仅有40FPS,几乎不可玩,可见这代显卡的实力不容小觑。

总的来说,得益于架构革新和缓存加大,这代RTX4080显卡在开启最高画质和DLSS的情况下,市面上的3A大作已经能够畅玩了,对于游戏玩家来说,耕升RTX4080炫光SOC绝对是一块趁手的游戏工具,如果想要满足4K@144Hz稍微降一点点画质即可。

5DLSS 3性能测试

DLSS 3性能测试

如果要我说40系显卡最亮眼的更新是什么,那毫无疑问是DLSS3,加入了帧生成和NVIDIAReflex技术,但是却能实现近乎翻倍的性能提升,还不影响游戏画质和延迟。到底有没有这么神,我们也选择了多款软件和游戏对耕升RTX4080炫光SOC进行实测,下面一起看看。

3DMarkDLSS3性能测试

在3DMark的DLSS3BenchMark中,实测耕升RTX4080炫光SOC的性能表现相当不错,在4K分辨率下开启DLSS3,帧率有着超过3倍的提升。而当分辨率来到了8K,提升更加惊人,在不开启DLSS3的情况下,仅有1.6帧,开启DLSS3后帧率直接暴涨到了70帧,提升幅度甚至比RTX4090还要大。

《暗影火炬城》游戏实测

单看理论性能怎么够,实践出真知,在《暗影火炬城》中,耕升RTX4080炫光SOC表现出了不凡的性能,DLSS2下,游戏帧数为194FPS,一旦开启DLSS3后,2K分辨率下已经可以去到255FPS,4K分辨率下181FPS,配上前面提到的AGONPD32M显示器,4K@144Hz电竞不再是梦。

2K分辨率与4K分辨率DLSS性能测试

只测一款游戏没有代表性,我们在2K、4K甚至8K分辨率下测试了多款游戏,这里汇总成一个表格给大家参考,从表格里可以看出基于AdaLovelace架构及TC4N工艺的耕升RTX4080炫光SOC,游戏性能确实强劲,在2K和4K分辨率下,只开DLSS2就已经超越RTX3080Ti很多了,到了DLSS3就直接变成RTX4080的主场,部分游戏性能甚至是RTX3080Ti的两倍。

8K分辨率DLSS3性能测试

在8K分辨率下,RTX4080还是有着不小的压力,即便是DLSS3加持,RTX4080还是会有爆显存的问题,游戏帧数反而更低了,只能说老黄的刀法是真精准,如果后续游戏厂商能够优化显存占用,那RTX4080体验8K@60Hz还是有可能的。

UnrealEngine5EnemiesDEMO

最后我们也测试了UnrealEngine5引擎制作的EnemiesDEMO,UE5作为全新的游戏开发引擎,对显卡的压力自是不小,而耕升RTX4080炫光SOC在DLSS3的加持下展现出了超强的实力,4K分辨率下可达77G/661%FPS/55ms的水平,而关闭DLSS3后仅有22G/171%FPS/195ms,几乎3倍以上的游戏流畅度提升。

并且从视频中可以看出,即使开启DLSS3后,画质几乎没有区别,由于DLSS是利用AI进行渲染,在部分细节上,DLSS模式下的画质甚至比原生画质还要清晰。

6创作性能测试

创作者性能测试

除了游戏性能,耕升RTX4080炫光SOC的大显存和算力提升也可以为各类产生力带来一系列的支持。这里我们选择PugetBench、PCMark10这两款常见的测试软件,来测试这款显卡在日常办公、视频内容生产等方面的性能表现。

从实测表格中你可能觉得耕升RTX4080炫光SOC对办公或视频剪辑的提升不大,其实不是的,由于Adobe等软件并不吃显卡的性能,所以差距不明显,但是耕升RTX4080炫光SOC上实打实的16GB大显存在处理复杂的项目时极具优势,像前代RTX3080Ti在处理大型项目时往往容易奔溃,而这一代显卡可以更好的胜任复杂任务。

如果说视频内容生产力的提升只是小步快跑,那在建模、渲染、工业设计等软件上耕升RTX4080炫光SOC就可以说是质的飞跃了,单是在Blender渲染软件中,耕升RTX4080炫光SOC相比前代RTX3080Ti就有50%以上的提升,面对RTX3090Ti也丝毫不虚,拉开了明显的差距。

而在SPECviewperf2020集成的8款工业软件测试中,耕升RTX4080炫光SOC相比RTX3090Ti也是全方位的领先,专业领域的用户升级显卡真的很有必要,它能够大幅提升工作效率。

当然这一代40系显卡还配备了第八代NVIDIANVENC编码器,加入了对1编码的支持。作为下一代的视频编码技术,1编码拥有更加快速的视频编码和更高质量的流媒体传输性能,目前许多主流媒体都已经支持,像达芬奇或万兴喵影等软件也开始逐步支持1编解码,未来1编码或许会成为一个新趋势。

所以我们也测试了耕升RTX4080炫光SOC的1编码的能力,我们使用NVIDIA提供的8K片源与工程文件进行测试,实测可以看到耕升RTX4080炫光SOC有着几乎RTX4090的性能表现。

并且同素材下,耕升RTX4080炫光SOC使用1编码时比H.265编码所需时间更短,即使同为H.265格式导出,导出时长相比RTX3080Ti也快了近62%左右。如果你是一名视频后期工作者,在1编解码方面,耕升RTX4080炫光SOC相比RTX4090,是一个更合适的选择。

值得一提的是,1还有一个优势就是占用空间小,并且画质几乎没有区别,这样也意味着1可以用更小的空间占用量实现与H.265同等规格的画质表现,总的来说,RTX40系上配备的双编解码器让耕升RTX4080炫光SOC在视频创作上有更多的用武之地。

7功耗/超频/总结

功耗与发热

这一代RTX4080的散热器是真的大,耕升RTX4080炫光SOC用的是与耕升RTX4090炫光OC同款散热器,其解热性能丝毫不用担心,我们使用甜甜圈单烤,15分钟后,GPU核心温度仅有64.8℃,显存温度更是只有56℃。

更重要的是它的功耗最高只去到330W左右,而前代卡皇RTX3090Ti的功耗已经390W了,耕升RTX4080炫光SOC用更低的功耗实现了更强的性能,并且风扇转速也还没有满载,几乎没有噪音。

超频测试

之前测试RTX4090时GPU核心频率已经能去到3000MHz以上,这让我对RTX4080的超频能力也充满好奇,下面我们就来简单的小超一下耕升RTX4080炫光SOC。

我们将风扇转速拉至100%,并且同时解锁GPU核心电压限制、功耗限制以及温度限制后,小超之下,耕升RTX4080炫光SOC在3DMark的PortRoyal测试中跑出了18417的分数,通过频率曲线可以看到,GPU的有效频率来到了2970MHz。

都能够跑到2970MHz了,不试试3000MHz怎么行,我们继续超频,这次3DMark的PortRoyal测试中耕升RTX4080炫光SOC的成绩达到了18554,有效频率也终于来到了3015MHz,相比默频情况下有着3.9%的提升,还是较为可观的。

评测总结

测完下来,耕升GeForceRTX408016GB炫光SOC无论是在理论性能、游戏、生产力,还是功耗控制、散热效能等方面的表现都非常亮眼,完胜前代的RTX3080Ti,甚至领先之前的卡皇RTX3090Ti不少。

除了性能的强势之外,这款显卡最大的特色就是它前卫的外观设计,极具赛博朋克风的电路板灯效,在千篇一律的显卡中脱颖而出。我敢说即使是对RGB不感冒的玩家在看到耕升RTX4080炫光SOC时,也会被它炫酷的RGB灯效所吸引。

40系上独有的DLSS3、1编解码器、极具潜力的超频等在耕升GeForceRTX408016GB炫光SOC上都一应俱全,可以说你想要体验4K光追流畅游戏,它必不可少;如果你是追求效率的生产力工作者,这款显卡的豪华配置能够让你感受工作效率的飞跃。

8ADA架构解析

Ada Lovelace架构讲解

Turing、Ampere上两代架构核心均以人物来命名,前者是计算机科学之父——艾伦·麦席森·图灵;后者则是“电学中的牛顿”——安德烈·玛丽·安培,电流的国际单位安培就是以其姓氏命名。那AdaLovelace定非凡人,度娘一下果然,这是 人称“数字女王”的阿达·洛芙莱斯,编写了历史上首款电脑程序,是被世界公认的第一位计算机程序员,果真是一代比一代还要更牛。PS:她的父亲是《唐璜》的作者,诗人拜伦喔。

从Turing架构开始,NVIDIA首次在显卡中加入了加速光线追踪的RTCore单元,以及面向AI推理的TensorCore单元,这革命性的创新使实时光线追踪成为可能。而Ampere架构则是全面的架构改进,在加入新一代的二代RTCore和三代TensorCore基础上,还有着更先进的单元设计,这样显卡工作效率那是翻倍的提升。而来到AdaLovelace架构,同时是以效率提升为大前提,自然是引入了最新的第三代RTCores与第四代TensorCores单元,同时加入众多新颖的黑科技,从执行效率来说AdaLovelace架构是上代Ampere架构的2倍以上,甚至光线追踪能力更是达到了恐怖的4倍性能。

全新的流式多处理器

AdaLovelace架构中最大的亮点之一:全新的流式多处理器,每个包含了128个CUDA核心、1个第三代的RTCores,4个第四代TensorCores(张量核心)、4个TextureUnits(纹理单元)、256KBRegisterFile(寄存器堆),以及128KBL1数据缓存/共享内存子系统,于是这一个全新的单元有着超过上一代2倍之的性能表现。

过去的Turing架构INT32计算单元与FP32数量是一致的,而两者相加才组成了64个CUDA核心。但是Ampere架构开始,左侧的计算单元实现了FP32+INT32的计算单元并发执行,也就是说CUDA核心数量翻倍到了128个。

再来看看AdaLovelace架构的,FP32/INT32的计算单元组合,同样实现了每个内含128个CUDA的设计,看似提升不大,但是当你了解到GeForceRTX4080拥有76个,9728个CUDA核心,那你也就应该明白达82.6TFLOPS的着色器能力是如何实现的了,比上一代的RTX3090Ti显卡的40TFLOPS,还真是提升了两倍有多。

另外缓存方面AdaLovelace架构也进行了大规格的提升,首先每个单元中单独配上了128KB的缓存,这样RTX4080显卡中就实现了97MBL1/共享内存。其次核心的二级缓存进行进行了重新的设计,并且完整AD103核心与RTX4080都是64MB二级缓存,相比RTX3080Ti可以说是质的飞跃。

技术讲解:第三代RT Cores与第四代Tensor Cores

以为刚才的CUDA数量与超大L2缓存就已经很猛了,实现上AdaLovelace架构最大的提升还是在第三代RTCores与第四代TensorCores身上。

第三代RTCores

RTCores用于光线追踪加速,第三代RTCores的有效光线追踪计算能力达到191TFLOPS,是上一代产品2.8倍。

在Ampere架构中,第二代RTCores支持边界交叉测试(BoxIntersectiontesting)和三角形交叉测试(TriangleIntersectiontesting),用于加速BVH遍历和执行射线三角交叉测试计算,虽然光线追踪处理能力已经比初代的Turing架构核心更高效,但是随着环境和物体的几何复杂性持续增加,传统的处理方式很难再以更高效率、正确反应出的现实世界中的光线,尤其是光的运动准确性。

所以在第三代RTCores增加了两个重要硬件单元:OpacityMicromapEngine与DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine,主要是用于alpha通道的加速,可以将alpha测试几何体的光线追踪速度提高2倍。

在传统光栅渲染中,开发人员使用一些Alpha通道的素材来实现更高效的画面渲染,例如Alpha通道的叶子或火焰等复杂形状的物体。但在光线追踪时代,这传统的做为光线追踪带为不少无效的计算,例如运动性的光线多次通过一块叶子,光线每击中一次叶子,都会调用一次着色器来确定如何处理相交,这时就会做成严重的执行成本与时间等待成本。

而OpacityMicromapEngine用于直接解析具有非不透明度光线交集的不透明度状态

三角形。根据Alpha通道的不透明,透明与未知等三个不同的块状态进行处理:透明则直接忽略继续找下一个,不透明块则记录并告之命中,而未知的则交给着色器来确定如何处理,这样GPU很大部分都不需要进行着色器的调试处理,能够实现更为高效的性能。

DisplacedMicro-MeshesEngine

如果说OpacityMicromapEngine加速的是面处理,那么DisplacedMicro-MeshesEngine就是几何曲面细节的加速器。如上图所示,在AdaLovelace架构中,通过1个基底三角形+位移地图,就可以创建出一个高度详细的几何网格,所需要资源占用比二代RTCores更低,效率也更高。

通过NVIDIA给出的创建14:1珊瑚蟹例子来说事,这里我们需要需要1.7万个微网格、160万个微三角形,在AdaLovelace架构中BVH创建速度可加快7.6倍,存储空间缩小8.1倍。DisplacedMicro-MeshesEngine起到了关键性的作用,其将一个几何物体根据不同细节分成密度不一的微网络处理,红色密度超高,细节处理越为复杂。相应的低密度微网络区域则可以释放更多的资源与存储空间,这样DisplacedMicro-MeshesEngine就可以帮助BVH加速过程,减少构建时间和存储成本。

同时AdaLovelace架构中新增了着色器执行重排序(ShaderExecutionReordering,SER),这是由于光线追踪不再只有强光或者阴影渲染处理,未来将会更多的是在光线的运动性,这样光线就会变得越来越复杂,想要第三代RTCores与第四代TensorCores有着更高的执行效率,那就得为他们来安排一位管家。而着色器执行重排序(SER)就是为了能够即时重新安排着色器负载来提高执行效率,为光线追踪提供2倍的加速,也能更好地利用GPU资源。不过目前仍未有实例,想实现这个功能,还得游戏与开发工具的支持才行。

第四代TensorCores

TensorCores是专门为执行张量/矩阵运算而设计的专用执行单元,这些运算是深度学习中使用的核心计算功能。第四代TensorCores新增FP8引擎,具有高达1.32petaflops的张量处理性能,超过上一代的5倍。

9技术讲解:DLSS 3

技术讲解:DLSS 3

或者说第四代TensorCores太硬核你不会知道是啥?提升意义在哪?但是TensorCores最经典的应用DLSS你肯定会知道,这一次AdaLovelace架构支持NVIDIA最新的DLSS3技术。

https://images.nvidia/cn/youtube-replicates/r-hu006p23I.mp4

之前我们也聊过DLSS技术,其设计之初是为了弥补光线追踪技术后的性能损失,具体的表现为开启光线追踪技术后游戏帧数大幅度的下降,甚至很难保证游戏流畅的运行。于是DLSS使用低分辨率内容作为输入并运用AI技术输出高分辨率帧,从而提升光线追踪的性能。

在DLSS3中包含了三项技术:DLSS帧生成、DLSS超分辨率(也称为DLSS2)和NVIDIAReflex。你可以理解为DLSS3是在DLSS2的基础上,新增了DLSS帧生成技术;而后两技术中,DLSS超分辨率只需要GeForceRTX显卡都能使用上,NVIDIAReflex则是GeForce900系列以后的显卡都用使用上。

想实现DLSS帧生成可不简单,这需要配合上AdaLovelace架构的GeForceRTX40系列显卡才行。DLSS帧生成技术原理是:利用AI技术生成更多帧,以此提升性能。DLSS会借助GeForceRTX40系列GPU所搭载的全新光流加速器分析连续帧和运动数据,进而创建其他高质量帧,同时不会影响图像质量和响应速度。

从Ampere架构开始,NVIDIA显卡就已经支持了光流加速器,而AdaLovelace架构的光流加速器升级到了第二代,其提供了高达300TeraOPS(TOPS),比安培架构的初代光流加速器(OpticalFlowAcceleration,OFA)快2倍以上。为了实现DLSS帧生成,OFA扮演了重要的角色,其配合上新的运行矢量分析算法在DLSS3技术框架内实现精确和高性能的帧生成能力。

另外,由于DLSS帧生成是在GPU上作为后处理执行的,那么即使在游戏受到CPU性能限制的时候,我们同样能够从中获得更好的游戏性能提升。尤其是那种物理计算密集型的游戏或大型场景游戏,DLSS2均可以让GeForceRTX40系列显卡以高达两倍于CPU可计算的性能来渲染游戏。

最后由于DLSS3是建立在DLSS2基础之上的,游戏开发者可以在已支持DLSS2或NVIDIAStreamline的现有游戏中快速集成该功能,所以DLSS3已在游戏生态得到广泛应用,目前已有超过35款游戏和应用即将支持该技术。

阅读小亮点:NVIDIAReflex

NVIDIAReflex也是DLSS3其中的一环,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。

想要实现端对端的最低延迟,你需要确保游戏、显示器以及鼠标三者都同时支持并开启了Reflex技术。

当GeForceRTX40系列显卡和NVIDIAReflex搭配上后,直接达到1440p分辨率360FPS的体验,这着实是性能有点强劲了。

在GTC2022大会时已经透露将会还有4款1440p分辨率的新型G-SYNC电竞显示器将要发布,包括采用mini-LED技术的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款显示器刷新率均为300Hz,而最猛的是ASUSROGSwift360HzPG27AQN,刷新率直接来到了360Hz。

但唯一一个问题就在于,部分显示器厂商认为此类产品受众人群较少,会降低此类显示器的产能,甚至产品就已经被内部PASS掉,所以1440p360Hz是很美好,但现实也是相当的骨感。

10技术讲解:双NVIDIA编码器(NVENC)

技术讲解:双NVIDIA编码器(NVENC)

GeForceRTX40系列显卡还有一个全新的升级,那就是双编码器NVENC。第八代的NVENC双编码器不仅支持H.264与H.265,还支持开放式视频编码格式1。

而由于1是一种免版税的视频编码格式,上游软件厂商与下游戏的配套端都在大力推广此编码格式,我们也会看到越来越多的硬件与软件支持1格式,包括剪映专业版、DaVinciResolve、以及AdobePremierePro较为流行的Voukoder插件均支持,且均可通过编码预设使用双编码器,这样我们等待视频导出的时间缩短将近一半。

不单是视频制作软件,1格式也将会是主播、游戏直播UP主们的新宠儿,在保证画面最高质量的情况下,1编码器可将效率提高40%,同时显卡的占用也更低。包括OBSStudio一一代软件中也会增加1格式的支持。另外我们还能通过GeForceExperience和OBSStudio录制高达8K60的内容,这样我们做游戏录制也会变得更为轻松。

包括我们之后测试时使用的游戏内录视频都是支持1格式,同时双编码器NVENC在资源占用和适配上做得越来越好。

热门推荐