今天小編分享的科技經驗:2024年的第一張良心顯卡!NVIDIA RTX 4070 SUPER首發評測,歡迎閱讀。
一、前言:性價比爆棚的GeForce RTX 40 SUPER系列顯卡
新一代的Ada Lovelace架構帶來了令人咋舌的能效比,RTX 40系列顯卡在性能相同的情況下,功耗只有上代一半甚至更低,只是價格并不是那麼親民。
2024年1月9日,NVIDIA發布了GeForce RTX 40 SUPER系列顯卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型号。
其中RTX 4070 SUPER以4899元的售價提供了接近于RTX 4070 Ti的性能;
而RTX 4070 Ti SUPER售價與RTX 4070 Ti同為6499元,但性能與9499元的RTX 4080相差無幾;
至于RTX 4080 SUPER,它在規格大幅度提升的情況下,将售價降到了8099元,比起RTX 4080足足便宜了1400元。
新一代RTX 40系列SUPER GPU的到來,瞬間讓NVIDIA顯卡性價比爆棚!
完整的AD104核心
RTX 4070 SUPER使用了與RTX 4070(Ti)相同的AD104核心。
完整的AD104核心共有7680個CUDA核心(分為5組GPC/30組TPC/60組SM)、240個第四代Tensor Core張量核心、60個第三代RT Core光追核心、240個紋理單元、80個ROP單元、3MB一級緩存、48MB二級緩存。
AD104-350核心(RTX 4070 SUPER)
RTX 4070 SUPER做了部分精簡,依然是5組GPC,只是将其中2組中的6個TPC減到了5個,也就是5組GPC、28個TPC、7168個流處理器、228個Tensor Core、56個RT Core、80個ROP單元、36MB二級緩存。
除了二級緩存之外,其他規格削減不到7%,而顯存規格維持不變,可以想象,它的性能會非常接近RTX 4070 Ti。
RTX 4070 SUPER的詳細規格參數如下:
二、圖賞:與RTX 4070長一樣 6+3相供電電路
包裝盒和RTX 4070公版差不多,區别在于原來是白字,現在改成了黑色字體。
開箱。
附贈一條2x8Pin轉16Pin的電源線。
上面是RTX 4070 SUPER,下面是RTX 4070,長相也幾乎一模一樣,差别在于4070的金屬條是銀灰色,4070 SUPER是深黑色,而且還能反光。
背面。
依然是16Pin供電接口,不過功耗很低,完全不用擔心燒化接口的情況。
3個DP1.4和1個HDMI 2.1接口。
沒有用均熱板,和RTX 4070一樣,都是銅底+熱管的散熱設計。
依舊是RTX 4070的PCB版,非常mini,改造成ITX版型也不難。
6+3相供電電路設計,雖然簡單,但也足夠應付220W的TGP。
這是RTX 4070的PCB板,對比一下,二者區别在于RTX 4070多一個空焊位,也就是少一相供電。
PCB板背面。
RTX 4070 SUPER采用的是AD104-350核心,芯片面積295mm2,擁有358億晶體管。
GPU旁邊是6顆美光GDDR6X顯存,單顆2GB,總容量12GB,等效頻率21GHz,帶寬504GB/s。
三、理論性能測試:3DMark運行頻率可達2805MHz
測試平台如下:
1、3DMark Fire Strike
在2K分辨率3DMark Fire Strike Extreme測試中,RTX 4070 SUPER圖形分數達到了24185分,核心溫度最高68℃,熱點溫度最高85℃,核心運行最高頻率為2805MHz,最高風扇轉速1397PM,整卡最高功耗222W。
在4K分辨率3DMark Fire Strike Ultra測試中,RTX 4070 SUPER圖形分數達到了12112分,核心溫度最高69℃,核心運行最高頻率為2805MHz,最高風扇轉速1397RPM,最高功耗222W。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy測試中,RTX 4070 SUPER圖形分數達到了20649分,核心溫度最高753℃,核心運行最高頻率為2790Hz,最高風扇轉速2028RPM,最高功耗223W。
在4K分辨率3DMark Time Spy Extreme測試中,RTX 4070 SUPER圖形分數達到了9948分,核心溫度最高74℃,核心運行最高頻率為2790Hz,最高風扇轉速13990RPM,最高功耗224W。
四、1080P遊戲性能測試:與RTX 3090 Ti旗鼓相當
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、霍格沃茨之遺
7、極限競速:地平線5
8、賽博朋克2077
9、巫師3
10、無主之地3
11、星空
12、戰争機器5
測試結果匯總如下:
在1080P分辨率下,RTX 4070 SUPER的性能與RTX 3090 Ti不相上下,差距僅有1%。比起RTX 4070強了13%,和RTX 4070 Ti相比就差了3%。
六、2K性能測試:強于RTX 3080 Ti
測試數據匯總如下:
2K分辨率下,RTX 4070 SUPER依然比RTX 3080 Ti強2%,與RTX 4070相比,也有14%的優勢,但是比RTX 4070 Ti則有5%的差距。
此外我們還測試了4K分辨率下的成績,匯總如下:
由于192Bit顯存位寬的關系,RTX 4070 SUPER在4K分辨率下的性能會明年不如RTX 3080 Ti,但大多數遊戲依舊能保持60FPS以上的幀率。
我們測試的12款3A大作,有3款幀率低于60FPS,但這幾款遊戲都支持DLSS 3,開啟之後幀率會有翻倍提升。
六、Stable Diffusion體驗:TensorRT加持 生圖速度提升350%
2023年9月,NVIDIA推出了用于Stable Diffusion Web UI 的TensorRT 加速插件,能讓具備Tensor單元的GeForce顯卡在Stable Diffusion Web UI 中獲得翻倍的性能。
本次我們将對比SDXL加速方法與PyTorch xFormers(常規加速方法)的性能差異。
我們生成10張太空大戰影像,分辨率1024*1024,使用PyTorch xFormers加速時,耗時9分17秒。
使用SDXL加速之後,耗時僅為2分02秒,性能提升350%。
從終端中也可以看到,RTX 4070 SUPER使用默認加速器時,生圖速度只有1.1it/s,而在TensorRT加持下,生圖速度猛然提升到了4.50it/s。
七、DLSS 3遊戲測試之一:3款DLSS 3遊戲
此次我們一共測試了6款遊戲,包括3款支持DLSS 3的遊戲:《3DMark》、《毀滅全人類》、《燕雲十六聲》。
另外還有3款同時支持DLSS與光追的遊戲:《光明記憶》:《生死輪回》、《賽博朋克2077》。
所有DLSS 3以及光追測試都是在2K分辨率下進行。
1、DLSS3 測試--燕雲十六聲
《燕雲十六聲》是一款開放世界中國風武俠動作遊戲,畫質精良,号稱國產3A破陣制作。目前這款遊戲還處于内測階段。
這款遊戲于日前推送了對于DLSS 3支持的更新,下面我們來看看RTX 4070 SUPER SUPER的表現,測試分辨率為2560*1440,畫質選項為"超高"。
默認超高畫質下,遊戲幀率為91FPS。
開啟DLSS 2(性能模式)之後,幀率達到了146FPS,提升了60%。
打開DLSS 3(插幀)之後,幀率來到了198FPS,相比默認畫質幀率提升了117%。
2、3DMark
DLSS 2模式下幀率為140FPS,比默認的65FPS提升了133%。
DLSS 3的成績為150FPS,相比默認提升了150%。
3、毀滅全人類2:重新探測
最高畫質下,RTX 4070 Ti的幀率為131FPS。
開啟DLSS 3之後,幀率來到了242FPS,近乎翻倍。
八、DLSS 3遊戲測試之二:3款支持DLSS 3的光追遊戲
1、光明記憶:無限
開啟RTX時,遊戲的幀率為109FPS。
開啟DLSS 3之後,幀率提升到了235FPS,提升了116%。
2、生死輪回
開啟光追之後,遊戲的幀率僅有65FPS。
打開DLSS 3之後,幀率提升到了195FPS,提升幅度為195%。
3、賽博朋克2077
開啟光追時,幀率為40FPS。
這是DLSS 3的畫面,與原生畫面的差距難以分辨,但是幀率提升到了155FPS。
九、功耗測試:2K遊戲平均功耗僅為3080 Ti的62%
将Furmark的參數設定為1920*1200分辨率、0AA。
運行13分鍾之後,RTX 4070 SUPER的溫度穩定在74度附近,功耗穩定在220W,烤機時GPU頻率為1620MHz,CPU風扇轉速只有2153RPM。
2)、真實遊戲功耗測試
1、GTA V
這是1080P分辨率。RTX 4070 SUPER功耗126W,溫度53度。
2K分辨率下,RTX 4070 SUPER功耗164W。
2、絕地求生
1080P分辨率下,RTX 4070 SUPER功耗203W,溫度689度,運行頻率2760MHz。
2K分辨率下,RTX 4070 SUPER0功耗212W。
3、古墓麗影:暗影
1080P分辨率下,RTX 4070 SUPER的功耗為207W。
2K分辨率下,RTX 4070 SUPER功耗是212W,運行頻率2745MHz,溫度64度。
在1080P分辨率下,RTX 4070 SUPER在3A遊戲中的平均功耗不到200W,2K分辨率也只有207W;就算是到了4K分辨率,平均功耗也只有214W,僅相當于RTX 3080 Ti的62%。
十、總結:堪稱業界良心
本次測試小結如下:
1、AI性能
即使沒有TensorRT 加速插件,RTX 40系列GPU也是Stable Diffusion畫圖首選,而今在TensorRT加持下,RTX 4070 SUPER的生圖速度在原有基礎上提升了350%,這樣的表現相信是不會再有任何競争對手了。
2、1080P遊戲性能
我們所測的12款遊戲,除了《星空》之外 ,剩餘11款遊戲RTX 4070 SUPER的幀率全部都超過了160FPS,就連顯卡殺手《賽博朋克2077》也有169FPS。
就性能而言,1080P分辨率下,RTX 4070 SUPER幾乎能與RTX 3090 Ti并駕齊驅,相比RTX 3080 Ti強了6%,比RTX 4070則強了13%,和4070 Ti的差距只有3%。
3、2K遊戲性能
2K分辨率下,同樣是除了《星空》之外,RTX 4070 SUPER在其他11款遊戲中都能保持120FPS以上的幀率。
在2K分辨率下,RTX 4070 SUPER依舊能比RTX 3080 Ti強2%,不過和RTX 4070 Ti的差距也拉大到了5%,比起RTX 4070則強了15%左右。
另外,我們也測試了4K,RTX 4070 SUPER在此分辨率下幀率會有較大損失,不過在絕大部分遊戲中依舊能夠跑出60FPS以上的幀率。
少數幾款顯卡殺手遊戲雖然幀率只有50PFS左右,但好在這些遊戲都支持DLSS 3,開啟之後幀率甚至能突破100FPS。
4、功耗
我們測試了6款3A大作的真實遊戲功耗,在1080P分辨率下,RTX 4070 SUPER的平均功耗是192W,而RTX 3080 Ti是312W。
2K分辨率下,RTX 4070 SUPER在6款遊戲中的平均功耗是207W,RTX 3080 Ti則是332W。
4K分辨率下,RTX 4070 SUPER在6款遊戲中的平均功耗為214W,RTX 3080 Ti則已經跑到了350W的TGP上限。
5、DLSS 3和光追
目前能玩的DLSS 3遊戲多達數十款,我們測試了6款。
在開啟DLSS 2之後,遊戲幀率平均提升幅度為107%。打開DLSS 3,遊戲幀率平均提升幅度達到了159%。
如今的NVIDIA GPU早已不是單純的遊戲顯卡,特别是在AI應用方面,有了SDXL,能将Stable Diffusion生圖速度提升4倍左右,讓原本已經大幅度領先對手的N卡徹底無敵。
至于價格,4899元就能買到一塊1080P性能堪比RTX 3090 Ti、2K性能強于RTX 3080 Ti的顯卡,同時遊戲功耗僅有200W左右,堪稱業界良心。
RTX 4070 SUPER只是開始,接下來的RTX 4070 Ti SUPER和RTX 4080 SUPER将會帶來更多的驚喜。
NVIDIA GeForce RTX 40 SIUPER系列現已上市,請到京東DIY SUPER超能年貨節上選購GeForce RTX 4070 SUPER/4080 SUPER 公版和合作夥伴顯卡。