Test ASUS GeForce RTX 3080 TUF Gaming - Niereferencyjny Ampere
- SPIS TREŚCI -
- 1 - TUF-ciu... dlaczego masz taki wielki radiator?
- 2 - Charakterystyka architektury NVIDIA Ampere
- 3 - ASUS GeForce RTX 3080 TUF Gaming - Budowa
- 4 - Platforma sprzętowa i ustawienia podczas testów
- 5 - Test wydajności - 3DMark Time Spy
- 6 - Test wydajności - Call of Duty Modern Warfare
- 7 - Test wydajności - Control
- 8 - Test wydajności - DOOM Eternal
- 9 - Test wydajności - Horizon Zero Dawn
- 10 - Test wydajności - Metro Exodus
- 11 - Test wydajności - Red Dead Redemption 2
- 12 - Test wydajności - Shadow of the Tomb Raider
- 13 - Test wydajności - Wiedźmin 3: Dziki Gon
- 14 - Test wydajności RT i DLSS - Control
- 15 - Test wydajności RT - Metro Exodus
- 16 - Test wydajności RT - Quake II RTX
- 17 - Overclocking - Maksymalne stabilne zegary
- 18 - Test wydajności - 3DMark Time Spy (OC)
- 19 - Test wydajności - Metro Exodus (OC)
- 20 - Test wydajności - Red Dead Redemption 2 (OC)
- 21 - Test wydajności - Wiedźmin 3: Dziki Gon (OC)
- 22 - Pobór mocy - Spoczynek i obciążenie
- 23 - Pomiar temperatur - Spoczynek i obciążenie
- 24 - Pomiar głośności - Spoczynek i obciążenie
- 25 - Podsumowanie - To jeszcze TUF czy prawie Strix?
CHARAKTERYSTYKA ARCHITEKTURY NVIDIA AMPERE
Architektura Ampere została gruntownie przebudowana i usprawniona względem Turinga, aczkolwiek rozwija wcześniejsze założenia oraz technologie, którym inżynierowie NVIDII poświęcili ostatnią dekadę. Priorytet stanowiła oczywiście poprawa wydajności sprzętowej akceleracji śledzenia promieni i efektywności DLSS, realizowanych poprzez dedykowane rdzenie (RT Cores i Tensor Cores). Rodzina GeForce RTX 2000 była największym skokiem jakościowym od momentu wprowadzenia zunifikowanych shaderów, które przejęły funkcje vertex i pixel shaderów, stworzonym do renderowania hybrydowego łączącego ray tracing w czasie rzeczywistym oraz tradycyjną rasteryzację. To stosunkowo świeża koncepcja, dlatego GeForce RTX 3000 podąża wcześniej wytyczoną ścieżką, poprawiając szereg techniczny niuansów, wykorzystując do tego między innymi niższy proces litograficzny, GDDR6X czy nowe bloki SM.
Karty graficzne bazujące na architekturze NVDIA Ampere otrzymały zmodyfikowane bloki SM (Streaming Multiprocessors). Każdy zawiera teraz 128 procesorów CUDA, zatem upakowanie jednostek cieniujących zwiększono dokładnie dwukrotnie, ponieważ Turing dysponował tutaj 64 procesorami CUDA. Ilość jednostek teksturujących i renderujących przypadających na pojedynczy SM Ampere nie uległa natomiast zwiększeniu w stosunku do poprzednika. Podobnie jak wcześniej, ilość bloków SM odpowiada zarazem ilości RT Cores tzn. GeForce RTX 3090 posiadający 82 SM dysponuje także 82 RT Cores. Turing posiadał jednak 8 rdzeni Tensor przypadających na każdy blok SM, podczas gdy Ampere zawiera tylko 4, chociaż nikogo nie powinno dziwić, że NVIDIA znacznie poprawiła ich wydajność (stąd możliwa była redukcja).
Układy Ampere otrzymały rdzenie Tensor trzeciej generacji, zajmujące mniej miejsca w strukturze krzemowej lecz znacznie lepiej przystosowane do głębokiego uczenia i wykorzystywania potencjału sieci neuronowej. NVIDIA podaje w swojej dokumentacji, że wydajność nowych tensorów jest prawie trzykrotnie większa od poprzednika. Dlatego zastosowano ich dwukrotnie mniej niż w Turingu - GeForce RTX 3080 posiada zaledwie połowę jednostek jakimi dysponował GeForce RXT 2080 Ti przy identycznej ilości bloków SM. Nowością jest również DLSS 2.1 / Ultra (Deep Learning Super Sampling) dedykowany głównie rozdzielczości 8K oraz GeForce RTX 3090. Sieć neuronowa z pomocą algorytmów sztucznej inteligencji będzie upscalowała obraz z rozdzielczości 2560x1440 do 7680x4320 pikseli.
Na potrzeby Ampere wprowadzono też rdzenie RT drugiej generacji, posiadające sprzętowo akcelerowaną funkcję BVH (Bounding Volume Hierarchy) - strukturę do przechowywania i szybkiego wykonywania zapytań dotyczących obiektów w przestrzeni trójwymiarowej. Nowa wersja rdzeni RT zastosowana w architekturze Ampere może również obliczać dokładny punkt zderzenia się promienia z powierzchnią, aby natychmiast oszacować jego dalszą trasę. Dodatkowo, rdzenie RT Ampere przyspieszają inne obliczenia powiązane z efektami graficznymi np. rozmycie ruchu. Żeby to osiągnąć wprowadzono dodatkowy element - blok logiczny - interpolujący pozycje trójkątów z jednostką ich przecięcia.
NVIDIA projektując bloki SM Ampere dwukrotnie zwiększyła efektywność operacji FP32 względem Turinga, co wymagało przeprojektowania ścieżki danych (datapath). Pozwoliło to jednak wykonywać obydwa rodzaje operacji (FP32 i INT32) z pełną wydajnością w cyklu zegarowym. Podwojenie ilości procesorów CUDA spowodowało też konieczność zwiększenia przepustowości oraz rozmiaru pamięci podręcznej L1, która w Ampere na każdy blok SM wynosi 128 KB zamiast 64 KB. NVIDIA do produkcji chipów wykorzystała 8 nm litografię Samsunga, charakteryzującą się większym upakowaniem tranzystorów niż litografia 12 nm FFN. Dla rdzenia TU102 (GeForce RTX 2080 Ti) gęstość tranzystorów sięgała 24,7 MTr/mm², podczas gdy Ampere GA102 (GeForce RTX 3080/3090) może się pochwalić wynikiem na poziomie 44,6 MTr/mm².
Karty graficzne NVIDIA GeForce RTX 3000 wykorzystują interfejs PCI-Express 4.0, pozostając oczywiście kompatybilne wstecznie z PCI-Express 3.0. Różnice w wydajności na korzyść nowszego standardu mogą wprawdzie występować w wysokich rozdzielczościach, jednak powinny być maksymalnie kilkuprocentowe. Architektura Ampere obsługuje też złączne HDMI 2.1 działające z pełną przepustowością (48 GB/s) razem z funkcją DCS (Display Stream Compression), pozwalając wyświetlić obraz 8K 60 Hz HDR. W kwestii tego ostatniego - wspierany jest 10-bitowy HDR. Funkcja SLI została zarezerwowana wyłącznie dla topowego GeForce RTX 3090, który posiada odpowiednie złącze NVLink, natomiast słabsze modele zostały go pozbawione.
Ciekawostką wprowadzoną razem z Ampere jest RTX IO, pozwalające na szybszą wymianę danych między układem graficznym i pamięcią masową (SSD). Kompresją oraz dekompresją zajmuje się tutaj bezpośrednio GPU, odciążając jednocześnie procesor centralny i pamięć systemową. Podobne rozwiązanie wprowadzono także w konsolach nowej generacji, a wykorzystuje ono interfejs Microsoft DirectStorage transferujący dane do pamięci karty graficznej. Co takiego to przyniesie? Przede wszystkim lepsze strumieniowanie tekstur w wysokiej rozdzielczości przy bezstratnej kompresji. Kolejnym rozwiązaniem mogącym zmienić oblicze gier komputerowych jest NVDIA Reflex, technologia mająca zapewniać znacznie niższe opóźnienia na poziomie silnika (poprzez SDK), która zostanie zaimplementowana w m.in. Valorant, Fortnite, Apex Legends. Jest też sprzętowa obsługa kodeka AV1.
- « pierwsza
- ‹ poprzednia
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- …
- następna ›
- ostatnia »
- SPIS TREŚCI -
- 1 - TUF-ciu... dlaczego masz taki wielki radiator?
- 2 - Charakterystyka architektury NVIDIA Ampere
- 3 - ASUS GeForce RTX 3080 TUF Gaming - Budowa
- 4 - Platforma sprzętowa i ustawienia podczas testów
- 5 - Test wydajności - 3DMark Time Spy
- 6 - Test wydajności - Call of Duty Modern Warfare
- 7 - Test wydajności - Control
- 8 - Test wydajności - DOOM Eternal
- 9 - Test wydajności - Horizon Zero Dawn
- 10 - Test wydajności - Metro Exodus
- 11 - Test wydajności - Red Dead Redemption 2
- 12 - Test wydajności - Shadow of the Tomb Raider
- 13 - Test wydajności - Wiedźmin 3: Dziki Gon
- 14 - Test wydajności RT i DLSS - Control
- 15 - Test wydajności RT - Metro Exodus
- 16 - Test wydajności RT - Quake II RTX
- 17 - Overclocking - Maksymalne stabilne zegary
- 18 - Test wydajności - 3DMark Time Spy (OC)
- 19 - Test wydajności - Metro Exodus (OC)
- 20 - Test wydajności - Red Dead Redemption 2 (OC)
- 21 - Test wydajności - Wiedźmin 3: Dziki Gon (OC)
- 22 - Pobór mocy - Spoczynek i obciążenie
- 23 - Pomiar temperatur - Spoczynek i obciążenie
- 24 - Pomiar głośności - Spoczynek i obciążenie
- 25 - Podsumowanie - To jeszcze TUF czy prawie Strix?
Powiązane publikacje

Test karty graficznej MSI GeForce RTX 5060 Ti Gaming 16 GB - Więcej pamięci graficznej, jednak czy proporcjonalnie do wydajności?
230
Test Assassin's Creed Shadows - PC kontra PlayStation 5. Test technik NVIDIA DLSS 4, AMD FSR i Intel XeSS, skalowanie wydajności
122
Test wydajności Assassin's Creed Shadows PC - Wymagania sprzętowe to większy problem, niż czarnoskóry samuraj
165
Test wydajności GTA V Enhanced - Ray tracing podnosi wymagania sprzętowe do poziomu GTA VI. Wielka aktualizacja na 10 rocznicę
178