GeForce GTX 1080首發評測 締造性能神話(2)
今年被很多人認為是VR元年,醞釀了多年的VR終于呈現出井噴式增長;今年同樣是GPU的爆發之年,時隔5年,28nm的GPU終于退出歷史舞臺,全新的14/16nm制程開始大放光彩。隨著NVIDIAPascal架構和AMDPolaris顯卡的大幅。...
似是故人的新架構
GeForceGTX1080采用了兩年前就已在GTC上被老黃透漏的全新架構――Pascal,“Pascal”依然取自一位著名物理學家的名字,國際單位制中壓力的單位“Pa”即以其姓氏命名。Pascal架構的第一款產品是4月初發布的TeslaP100,其采用GP100大核心,而這次發布的GTX1080則是采用GP104核心,具體型號為GP104-400,次旗艦GTX1070為GP104-200。GP104核心面積約為314平方毫米,得益于16nm的制程優勢,核心內集成了72億晶體管,是GTX980晶體管數量的1.38倍,核心面積卻僅為GTX980的78.9%。
NVIDIAGP104-400核心
基于Pascal架構的GM204-400芯片運算資源總量為2560個ALU,TFU數量為160個,后端的ROPs數量為64個,四個帶寬為64bit的雙通道顯存控制器組成了總量為256bit的顯存控制單元,大小為8GB。同GTX980相比,其各項參數均有所提升,尤其是顯存帶寬達到了320GB/s,這是因為其率先采用了GDDR5X顯存,GDDR5X顯存的改進使得GTX1080在位寬相同的情況下擁有更高的帶寬,初期即可達到10-12Gbps,而隨著進一步的研發最高能夠提升到16Gbps。
顯卡規格比較表 | ||||
顯卡型號 | GTX1080 | R9FuryX |
GTX980 |
GTXTitanX |
首發限價 | /$599 | /$649 | /$549 | /$999 |
GPU代號 | GP104 | FijiXT | GM204 | GM200 |
GPU工藝 | 16nm | 28nm | 28nm | 28nm |
GPU晶體管 | 7.2B | 8.9B | 5.2B | 8B |
著色器數量 | 2560 | 4096 | 2048 | 3072 |
單精度浮點 | 9T | 8.6T | 5T | 7T |
ROPs數量 | 64 | 64 | 64 | 96 |
紋理單元數量 | 160 | 256 | 128 | 192 |
核心頻率 | 1607MHz | 1050MHz | 1126MHz | 1000MHz |
boost頻率 | 1733MHz | 1050MHz | 1216MHz | 1075MHz |
架構 | Pascal | GCN | Maxwell | Maxwell |
顯存頻率 | 2500MHz | 500MHz | 1753MHz | 1753MHz |
內存位寬 | 256bit | 4096bit | 256bit | 384bit |
內存帶寬 | 320GB/s | 512GB/s | 224GB/s | 336GB/s |
內存類型 | GDDR5X | HBM | GDDR5 | GDDR5 |
內存容量 | 8GB | 4GB | 4GB | 12GB |
注:表中售價均為官方首發限價
我們可以看到GeForceGTX1080的默認核心頻率達到了驚人的1607MHz,Boost頻率為1733MHz,顯存帶寬為320GB/s,這款產品完整支持DirectX12API以及異步運算,在DX12中有著更好的表現。GTX1080的默認PixelFillrate能力達到了102.8Gpiexls/S,默認TextureFillrate能力為277.3Gtexels/S。憑借超高的基礎頻率和龐大的運算規模,GTX1080擁有9TFLOPS的超高單精度浮點運算能力,照比GTXTitanX提升了28%,甚至超越了R9FuryX的8.6TFLOPS單精度浮點運算能力,成為目前單精度浮點運算性能最高的游戲顯卡。
GP104架構圖
Pascal架構GP104-400芯片由以下主要的部分組成:
1、基于TSMC的16nmFinFET工藝。
2、4單元的宏觀并行結構,20組SMs單元被分為4個GPC,每個GPC包含5組SMs。
3、20組全新設計的,包含了幾何引擎、光柵化引擎以及線程仲裁管理機制的SMs單元。每個SMs單元包含一組負責處理幾何任務需求的PolyMorphEngine,同時均下轄5組更基本的SM單元,每個SMs單元包含8個負責處理材質以及特種運算任務如卷積、快速傅里葉變換等的TextureArray,四組并行的二級線程管理機制以及對應的shared+UnifiedCache等緩沖體系。
4、GP104擁有8個32位顯存控制器,總計256位,每個32位顯存控制器包含8個ROPs單元和256KB二級緩存,共計64個ROPs單元和2M二級緩存。
5、改進型的4.0版本PolyMorphEngine,包含了為VR設計的TheSimultaneousMulti-ProjectionEngine,在極端情況下,SMP引擎可以減少32倍VR所需的幾何渲染工作量。
GP104SM單元架構圖
在GeForceGTX1080上,我們看到了其與上代基于Maxwell2.0架構顯卡相類似的設計,主要區別就是每個GPC中多了一組SMs單元。這就讓這款顯卡能夠支持所有在GeForceGTX900系列中的特性,以后使用到這款顯卡的玩家能夠獲得與其他采用基于Maxwell2.0架構設計的顯卡的體驗。