首款256Bit位寬的RTX 4070系列顯卡
2022年9月,RTX 4070 Ti在發(fā)布前爆出了個(gè)烏龍,由于其性能可以媲美RTX 3090 Ti,NVIDIA有意將它命名為RTX 4080 12GB。
但是192Bit位寬的RTX 4080玩家是絕對(duì)無(wú)法接受的(就算性能再?gòu)?qiáng)也無(wú)濟(jì)于事),NV最終順應(yīng)民意做出了妥協(xié),這才有了售價(jià)6488元的RTX 4070 Ti。
2024年1月9日,NVIDIA發(fā)布了GeForce RTX 40 SUPER系列顯卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型號(hào)。
首先上市的是RTX 4070 SUPER,現(xiàn)在輪到了RTX 4070 Ti SUPER,這是首款擁有256Bit顯存位寬的RTX 4070系列顯卡,同時(shí)還采用了更高一級(jí)的AD 103核心,但售價(jià)依舊維持6488元不變。
這是完整的AD103核心,是為RTX 4080 SUPER準(zhǔn)備的,芯片面積378.6平方毫米,集成了多達(dá)459億個(gè)晶體管。
AD103核心內(nèi)部組成可以分為7組GPC、40組TPC、80-組SM,每一組SM 128個(gè)CUDA核心,整個(gè)核心總計(jì)10240個(gè)CUDA核心。
AD103-275核心,也就是RTX 4070 Ti SUPER,直接屏蔽掉了下面一組GPC,一共還剩6組GPC、33組TPC、66個(gè)SM單元共8448個(gè)流處理器。
另外,它還有264個(gè)第四代Tensor張量核心、66個(gè)第三代RT光追核心、264個(gè)紋理單元、96個(gè)ROP單元以及48MB二級(jí)緩存。
RTX 4070 Ti SUPER詳細(xì)規(guī)格參數(shù)如下:
可以看到,RTX 4070 Ti SUPER與其他4070相比,顯存位寬從192Bit升級(jí)到了256Bit,帶寬達(dá)到了672GB/s,再配合48MB二級(jí)緩存,應(yīng)付4K游戲不會(huì)有太大問(wèn)題。
RTX 4070 Ti SUPER和RTX 4070 Ti一樣沒(méi)有FE公版,本次首發(fā)采用的是影馳大將版本,價(jià)格6488元。
整卡大小為333*140*62mm,三槽厚度。
正面有3個(gè)特制靜霜風(fēng)扇,風(fēng)扇直徑92mm,支持智能啟停,在溫度低于60度時(shí)停轉(zhuǎn)。
全尺寸金屬背板,尾部還采用了鏤空設(shè)計(jì),氣流可直接吹透,提升散熱效率。
標(biāo)準(zhǔn)的一個(gè)HDMI、三個(gè)DisplayPort接口。
兩段式散熱器,一共有8條6mm復(fù)合熱管,這熱管數(shù)量在RTX 4070 Ti SUPER應(yīng)該是最多的一檔。
GeForce RTX 4070 Ti SUPER 大將為8層PCB,緊湊設(shè)計(jì)嚴(yán)謹(jǐn)合理,電氣性能更好。
11+2相供電電路設(shè)計(jì),滿足285W整卡功耗非常富余。
RTX 4080采用的是AD103-275核心,芯片面積378mm2,擁有459億晶體管。
GPU旁邊是8顆美光GDDR6X顯存,單顆2GB,總?cè)萘?6GB,等效頻率21GHz,帶寬672GB/s。
測(cè)試平臺(tái):i9-14900K + ROG MAXIMUS Z790 DARK HERO主板
測(cè)試平臺(tái)如下:
1、i9-14900K
在銳龍7 7800X3D與i9-14900K之間,選了后者。
2、ROG MAXIMUS Z790 DARK HERO主板
這塊主板設(shè)計(jì)了20+1+2的供電電路,每相供電配備一個(gè)日系富士通 MIL 系列10K黑金固態(tài)電容,一個(gè)MICRO FINE粉末化超合金電感,以及一個(gè)90A的DrMOS。
整個(gè)供電電路可以提供超過(guò)1500W的功率輸出,就算是使用液氮極限超頻也沒(méi)問(wèn)題。
理論性能測(cè)試:3DMark最高運(yùn)行頻率2760MHz 風(fēng)扇轉(zhuǎn)速不超過(guò)1300RPM
1、3DMark Fire Strike
在2K分辨率3DMark Fire Strike Extreme測(cè)試中,RTX 4070 Ti SUPER圖形分?jǐn)?shù)達(dá)到了28577分,核心溫度最高62℃,熱點(diǎn)溫度最高75℃,核心運(yùn)行最高頻率為2760MHz,最高風(fēng)扇轉(zhuǎn)速1207PM,整卡最高功耗283W。
在4K分辨率3DMark Fire Strike Ultra測(cè)試中,RTX 4070 Ti SUPER圖形分?jǐn)?shù)達(dá)到了14155分,核心溫度最高63℃,核心運(yùn)行最高頻率為2760MHz,最高風(fēng)扇轉(zhuǎn)速1285RPM,最高功耗291W。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy測(cè)試中,RTX 4070 Ti SUPER圖形分?jǐn)?shù)達(dá)到了24024分,核心溫度最高64℃,核心運(yùn)行最高頻率為2745Hz,最高風(fēng)扇轉(zhuǎn)速1305RPM,最高功耗289W。
在4K分辨率3DMark Time Spy Extreme測(cè)試中,RTX 4070 Ti SUPER圖形分?jǐn)?shù)達(dá)到了11878分,核心溫度最高64℃,核心運(yùn)行最高頻率為2760Hz,最高風(fēng)扇轉(zhuǎn)速1215RPM,最高功耗291W。
五、1080P游戲性能測(cè)試:比RTX 3090 Ti強(qiáng)8%
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、霍格沃茨之遺
7、極限競(jìng)速:地平線5
8、賽博朋克2077
9、巫師3
10、無(wú)主之地3
11、星空
12、戰(zhàn)爭(zhēng)機(jī)器5
測(cè)試結(jié)果匯總?cè)缦拢?/p>
1080P分辨率下,RTX 4070 Ti SUPER的幀率基本能跑到140FPS以上,比起RTX 3090 Ti要快了8%,比RTX 4070 Ti則快了5%。
六、2K游戲性能測(cè)試:比RTX 3090 Ti強(qiáng)5%
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、霍格沃茨之遺
7、極限競(jìng)速:地平線5
8、賽博朋克2077
9、巫師3
10、無(wú)主之地3
11、星空
12、戰(zhàn)爭(zhēng)機(jī)器5
測(cè)試結(jié)果匯總?cè)缦拢?/p>
七、4K游戲性能測(cè)試:與RTX 3090 Ti不分勝負(fù)
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、霍格沃茨之遺
7、極限競(jìng)速:地平線5
8、賽博朋克2077
9、巫師3
10、無(wú)主之地3
11、星空
12、戰(zhàn)爭(zhēng)機(jī)器5
測(cè)試結(jié)果匯總?cè)缦拢?/p>
4K分辨率下,RTX 4070 Ti SUPER只有2款游戲幀率不足60FPS,但他們都能支持DLSS 3。
與RTX 4070 Ti相比,能夠領(lǐng)先9%;至于RTX 3090 Ti,二者互有勝負(fù),差距僅有0.3%。
八、StableDiffusion體驗(yàn):SDXL可將生圖速度提升200%
2023年9月,NVIDIA推出了用于Stable Diffusion Web UI 的TensorRT 加速插件,能讓具備Tensor單元的GeForce顯卡在Stable Diffusion Web UI?中獲得翻倍的性能。
本次我們將對(duì)比SDXL加速方法與PyTorch xFormers(常規(guī)加速方法)的性能差異。
我們生成20張?zhí)沾髴?zhàn)圖像,分辨率1024*1024,使用PyTorch xFormers加速時(shí),耗時(shí)8分鐘。
使用SDXL加速之后,耗時(shí)僅為2分59秒。
結(jié)合終端數(shù)據(jù),可以看到RTX 4070 Ti SUPER使用默認(rèn)加速器時(shí),生圖速度只有2.2it/s,而在TensorRT加持下,生圖速度直接到了6.9it/s,提升幅度為200%。
九、DLSS3游戲測(cè)試之一:4款DLSS3游戲
此次我們一共測(cè)試了8款游戲,包括4款支持DLSS 3的游戲:《3DMark》、《毀滅全人類》、《星空》、《微軟模擬飛行》。
另外還有4款同時(shí)支持DLSS與光追的游戲:《光明記憶》、《生死輪回》、《賽博朋克2077》、《霍格沃茨之遺》。
所有DLSS 3以及光追測(cè)試都是在2K分辨率下進(jìn)行。
1、星空
最高畫(huà)質(zhì)下,RTX 4070 Ti SUPER幀率81FPS。
開(kāi)啟DLSS 3之后,幀率為159FPS,提升幅度將近100%。
2、微軟模擬飛行
2K分辨率最高畫(huà)質(zhì)下,RTX 4070 Ti SUPER的幀率為122FPS。
開(kāi)啟DLSS 3之后,幀率達(dá)到了257,提升111%。
3、毀滅全人類2:重新探測(cè)
最高畫(huà)質(zhì)下,RTX 4070 Ti SUPER的幀率為154FPS。
開(kāi)啟DLSS 3之后,幀率來(lái)到了276FPS,近乎翻倍。
4、3DMark
DLSS 2模式下幀率為164FPS,比默認(rèn)的71FPS提升了131%。
DLSS 3的成績(jī)?yōu)?72FPS,相比默認(rèn)提升了142%。
十、DLSS3游戲測(cè)試之一:4款支持DLSS3的光追游戲
1、光明記憶:無(wú)限
開(kāi)啟光追時(shí),游戲的幀率為126FPS。
開(kāi)啟DLSS 3之后,幀率提升到了258FPS,提升了105%。
2、生死輪回
開(kāi)啟光追之后,游戲的幀率僅有78FPS。
打開(kāi)DLSS 3之后,幀率提升到了225FPS,提升幅度為158%。
3、賽博朋克2077
開(kāi)啟光追時(shí),幀率為49FPS。
這是DLSS 3的畫(huà)面,與原生畫(huà)面的差距難以分辨,但是幀率提升到了174FPS。
4、霍格沃茨之遺
開(kāi)啟光追時(shí),幀率為73FPS。
打開(kāi)DLSS 3之后,幀率來(lái)到了204FPS,提升幅度高達(dá)179%。
測(cè)試數(shù)據(jù)匯總?cè)缦拢?/p>
十一、實(shí)際功耗測(cè)試:2K游戲平均功耗232W
1、烤機(jī)測(cè)試
將Furmark的參數(shù)設(shè)定為1920*1200分辨率、0AA。
運(yùn)行13分鐘之后,影馳RTX 4070 Ti SUPER大將的溫度穩(wěn)定在66度附近,功耗穩(wěn)定在285W,烤機(jī)時(shí)GPU頻率為2085MHz,CPU風(fēng)扇轉(zhuǎn)速只有1705RPM。
2)、真實(shí)游戲功耗測(cè)試
1、GTA V
1080P分辨率下,RTX 4070 Ti SUPER的功耗為119W,而RTX 3090 Ti則高達(dá)218W。
2K分辨率下,RTX 4070 Ti SUPER功耗是162W,運(yùn)行頻率2760MHz,溫度45度。
RTX 3090 Ti的功耗為277W,運(yùn)行頻率2040MHz,溫度50度。
到了4K分辨率,RTX 4070 Ti SUPER的功耗是2277W,而RTX 3090 Ti功耗為378W。
2、絕地求生
1080P分辨率下,RTX 4070 Ti SUPER的功耗為234W,而RTX 3090 Ti則高達(dá)394W。
2K分辨率下,RTX 4070 Ti SUPER功耗是230W,運(yùn)行頻率2730MHz,溫度59度。
RTX 3090 Ti的功耗為404W,運(yùn)行頻率2010MHz,溫度86度。
到了4K分辨率,RTX 4070 Ti SUPER的功耗是277W,而RTX 3090 Ti功耗為433W。
3、古墓麗影:暗影
1080P分辨率下,RTX 4070 Ti SUPER的功耗為251W,而RTX 3090 Ti則高達(dá)374W。
2K分辨率下,RTX 4070 Ti SUPER功耗是2560W,運(yùn)行頻率2730MHz,溫度61度。
RTX 3090 Ti的功耗為400W,運(yùn)行頻率20250MHz,溫度65度。
到了4K分辨率,RTX 4070 Ti SUPER的功耗是270W,而RTX 3090 Ti功耗為432W。
測(cè)試數(shù)據(jù)匯總?cè)缦拢?/p>
RTX 4070 Ti SUPER在1080P、2K與4K分辨率下的游戲功耗分別為214W、232W、263W,大約是RTX 3090 Ti的60%。
十二、總結(jié):眼饞RTX 4080的可以下手了
本次測(cè)試小結(jié)如下:
1、性能
受制于192Bit顯存位寬,RTX 4070 Ti在1080P和2K分辨率下的性能表現(xiàn)雖然可以媲美甚至超越RTX 3090 Ti,但是受制于192Bit位寬,它在4K分辨率下表現(xiàn)不盡如人意,與RTX 3090 Ti慢了大概10%。
現(xiàn)在,擁有256Bit位寬的RTX 4070 Ti SUPER則是全面戰(zhàn)勝了RTX 3090 Ti,也完全可以應(yīng)付運(yùn)行4K游戲的幀率需求。
我們所測(cè)試的12款3A游戲,僅有《賽博朋克2077》與《星空》這2款游戲幀率沒(méi)達(dá)到60幀,而剛好這2款游戲都能支持DLSS 3,在開(kāi)啟此功能之后,幀率可以從56FPS提升到120FPS以上。
至于其他10款游戲,幀率都在70FPS以上。
在1080P分辨率下,RTX 4070 Ti SUPER比RTX 3090 Ti強(qiáng)了8%,比RTX 4070 Ti強(qiáng)了5%,比起RTX 38080 Ti則是強(qiáng)了15%之多。
2K分辨率下,RTX 4070 Ti SUPER依舊能夠領(lǐng)先RTX 3090 Ti約5%,比RTX 4070 Ti快了6%,比起RTX 3080 Ti則有15%的優(yōu)勢(shì)。
4K分辨率下,RTX 4070 Ti SUPER與RTX 3090 Ti互有勝負(fù),二者性能差異不到0.5%,相比RTX 4070 Ti則能領(lǐng)先9%。
2、功耗
進(jìn)入RTX 40系之后,TGP不再代表顯卡的真實(shí)功耗,而是指功耗墻,正常情況下的運(yùn)行功耗會(huì)遠(yuǎn)低于TGP數(shù)字。
總體來(lái)看,RTX 4070 Ti SUPER的游戲功耗約為RTX 3090 Ti的60%,考慮到性能上的提升,因而在能效比方面,RTX 4070 Ti SUPER幾乎是前代卡皇的2倍。
?
我們測(cè)試了6款3A大作的真實(shí)游戲功耗,在1080P分辨率下RTX 4070 Ti SUPER的平均功耗是214W,而RTX 3080 Ti是314W,RTX 3090 Ti則是356W。
2K分辨率下,RTX 4070 Ti SUPERi在6款游戲中的平均功耗是232W,RTX 3080 Ti和RTX 3090 Ti則分別是332W、390W。
4K分辨率下,RTX 4070 Ti SUPER在6款游戲中的平均功耗為263W,而RTX 3080 Ti已經(jīng)跑到了350W的TGP上限,RTX 3090 Ti則高達(dá)428W。
4、DLSS 3和光追
目前可玩的DLSS 3游戲已有60余款,此次我們測(cè)試了9款。
在開(kāi)啟DLSS 2之后,游戲幀率提升幅度為81%。打開(kāi)DLSS 3,游戲幀率提升幅度達(dá)到了140%。
由于RTX 3090 Ti不支持DLSS 3技術(shù),因此在這些游戲中的幀率已經(jīng)是全面落后于RTX 4070 Ti SUPER。
至于光追,RTX 4070 Ti SUPER擁有66個(gè)第三代RT Core,開(kāi)啟光追之后,游戲幀率平均下跌53%,而RTX 3090 Ti下降幅度達(dá)到了60%,新一代的光追單元運(yùn)算效率比前輩要高了不少。
5、AI性能
如今RTX GPU的AI性能已經(jīng)獨(dú)步天下,即便是不適用TensorRT 加速插件,RTX 40系列GPU也是Stable Diffusion畫(huà)圖首選,而今在TensorRT加持下,RTX 4070 Ti SUPER的生圖速度可以直接提升200%以上,至此已無(wú)任何對(duì)手。
至于價(jià)格,也許你曾經(jīng)對(duì)于RTX 4080強(qiáng)悍的性能心動(dòng)不已,但面對(duì)其9499元的售價(jià)只能望而卻步。
現(xiàn)在RTX 4070 Ti SUPER同樣擁有256Bit位寬以及16GB大容量顯存,在性能上的差距有只有15%左右,但是價(jià)格只有6499元,足足便宜了3000元之多。
眼饞RTX 4080的玩家可以動(dòng)手了,而這就是RTX 4070 Ti SUPER誕生的意義。
審核編輯:黃飛
?
評(píng)論
查看更多