Test ASUS GeForce RTX 3080 TUF Gaming - Niereferencyjny Ampere

Sebastian Oktaba | 17-09-2020 15:00 |

Karty graficzne

- SPIS TREŚCI -

CHARAKTERYSTYKA ARCHITEKTURY NVIDIA AMPERE

Architektura Ampere została gruntownie przebudowana i usprawniona względem Turinga, aczkolwiek rozwija wcześniejsze założenia oraz technologie, którym inżynierowie NVIDII poświęcili ostatnią dekadę. Priorytet stanowiła oczywiście poprawa wydajności sprzętowej akceleracji śledzenia promieni i efektywności DLSS, realizowanych poprzez dedykowane rdzenie (RT Cores i Tensor Cores). Rodzina GeForce RTX 2000 była największym skokiem jakościowym od momentu wprowadzenia zunifikowanych shaderów, które przejęły funkcje vertex i pixel shaderów, stworzonym do renderowania hybrydowego łączącego ray tracing w czasie rzeczywistym oraz tradycyjną rasteryzację. To stosunkowo świeża koncepcja, dlatego GeForce RTX 3000 podąża wcześniej wytyczoną ścieżką, poprawiając szereg techniczny niuansów, wykorzystując do tego między innymi niższy proces litograficzny, GDDR6X czy nowe bloki SM.

Karty graficzne bazujące na architekturze NVDIA Ampere otrzymały zmodyfikowane bloki SM (Streaming Multiprocessors). Każdy zawiera teraz 128 procesorów CUDA, zatem upakowanie jednostek cieniujących zwiększono dokładnie dwukrotnie, ponieważ Turing dysponował tutaj 64 procesorami CUDA. Ilość jednostek teksturujących i renderujących przypadających na pojedynczy SM Ampere nie uległa natomiast zwiększeniu w stosunku do poprzednika. Podobnie jak wcześniej, ilość bloków SM odpowiada zarazem ilości RT Cores tzn. GeForce RTX 3090 posiadający 82 SM dysponuje także 82 RT Cores. Turing posiadał jednak 8 rdzeni Tensor przypadających na każdy blok SM, podczas gdy Ampere zawiera tylko 4, chociaż nikogo nie powinno dziwić, że NVIDIA znacznie poprawiła ich wydajność (stąd możliwa była redukcja).

Układy Ampere otrzymały rdzenie Tensor trzeciej generacji, zajmujące mniej miejsca w strukturze krzemowej lecz znacznie lepiej przystosowane do głębokiego uczenia i wykorzystywania potencjału sieci neuronowej. NVIDIA podaje w swojej dokumentacji, że wydajność nowych tensorów jest prawie trzykrotnie większa od poprzednika. Dlatego zastosowano ich dwukrotnie mniej niż w Turingu - GeForce RTX 3080 posiada zaledwie połowę jednostek jakimi dysponował GeForce RXT 2080 Ti przy identycznej ilości bloków SM. Nowością jest również DLSS 2.1 / Ultra (Deep Learning Super Sampling) dedykowany głównie rozdzielczości 8K oraz GeForce RTX 3090. Sieć neuronowa z pomocą algorytmów sztucznej inteligencji będzie upscalowała obraz z rozdzielczości 2560x1440 do 7680x4320 pikseli.

Na potrzeby Ampere wprowadzono też rdzenie RT drugiej generacji, posiadające sprzętowo akcelerowaną funkcję BVH (Bounding Volume Hierarchy) - strukturę do przechowywania i szybkiego wykonywania zapytań dotyczących obiektów w przestrzeni trójwymiarowej. Nowa wersja rdzeni RT zastosowana w architekturze Ampere może również obliczać dokładny punkt zderzenia się promienia z powierzchnią, aby natychmiast oszacować jego dalszą trasę. Dodatkowo, rdzenie RT Ampere przyspieszają inne obliczenia powiązane z efektami graficznymi np. rozmycie ruchu. Żeby to osiągnąć wprowadzono dodatkowy element - blok logiczny - interpolujący pozycje trójkątów z jednostką ich przecięcia.

NVIDIA projektując bloki SM Ampere dwukrotnie zwiększyła efektywność operacji FP32 względem Turinga, co wymagało przeprojektowania ścieżki danych (datapath). Pozwoliło to jednak wykonywać obydwa rodzaje operacji (FP32 i INT32) z pełną wydajnością w cyklu zegarowym. Podwojenie ilości procesorów CUDA spowodowało też konieczność zwiększenia przepustowości oraz rozmiaru pamięci podręcznej L1, która w Ampere na każdy blok SM wynosi 128 KB zamiast 64 KB. NVIDIA do produkcji chipów wykorzystała 8 nm litografię Samsunga, charakteryzującą się większym upakowaniem tranzystorów niż litografia 12 nm FFN. Dla rdzenia TU102 (GeForce RTX 2080 Ti) gęstość tranzystorów sięgała 24,7 MTr/mm², podczas gdy Ampere GA102 (GeForce RTX 3080/3090) może się pochwalić wynikiem na poziomie 44,6 MTr/mm².

Karty graficzne NVIDIA GeForce RTX 3000 wykorzystują interfejs PCI-Express 4.0, pozostając oczywiście kompatybilne wstecznie z PCI-Express 3.0. Różnice w wydajności na korzyść nowszego standardu mogą wprawdzie występować w wysokich rozdzielczościach, jednak powinny być maksymalnie kilkuprocentowe. Architektura Ampere obsługuje też złączne HDMI 2.1 działające z pełną przepustowością (48 GB/s) razem z funkcją DCS (Display Stream Compression), pozwalając wyświetlić obraz 8K 60 Hz HDR. W kwestii tego ostatniego - wspierany jest 10-bitowy HDR. Funkcja SLI została zarezerwowana wyłącznie dla topowego GeForce RTX 3090, który posiada odpowiednie złącze NVLink, natomiast słabsze modele zostały go pozbawione.

Ciekawostką wprowadzoną razem z Ampere jest RTX IO, pozwalające na szybszą wymianę danych między układem graficznym i pamięcią masową (SSD). Kompresją oraz dekompresją zajmuje się tutaj bezpośrednio GPU, odciążając jednocześnie procesor centralny i pamięć systemową. Podobne rozwiązanie wprowadzono także w konsolach nowej generacji, a wykorzystuje ono interfejs Microsoft DirectStorage transferujący dane do pamięci karty graficznej. Co takiego to przyniesie? Przede wszystkim lepsze strumieniowanie tekstur w wysokiej rozdzielczości przy bezstratnej kompresji. Kolejnym rozwiązaniem mogącym zmienić oblicze gier komputerowych jest NVDIA Reflex, technologia mająca zapewniać znacznie niższe opóźnienia na poziomie silnika (poprzez SDK), która zostanie zaimplementowana w m.in. Valorant, Fortnite, Apex Legends. Jest też sprzętowa obsługa kodeka AV1.

- SPIS TREŚCI -

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Test wydajności Dying Light: The Beast - Nie potrzeba potwora do grania? Wymagania sprzętowe nie straszą... ale są niespodzianki

Test GTA V Enhanced - Analiza jakości obrazu, skalowania DLSS4 i wpływu Frame Generation na opóźnienia systemowe

165

Test kart graficznych 8 GB vs 16 GB VRAM na przykładzie GeForce RTX 5060 Ti vs Radeon RX 9060 XT. Także na obniżonych detalach

161

Test Cronos: The New Dawn PC. Jakość technik NVIDIA DLSS 4, AMD FSR 3.1 oraz Intel XeSS 2. Frame Generation i skalowanie wydajności

273

Test wydajności Cronos: The New Dawn - Dead Space po polsku, czyli za komuny nie było lepiej! Świetna grafika i wysokie wymagania

197

Liczba komentarzy: 297

Komentarze:

Załaduj komentarze

Test ASUS GeForce RTX 3080 TUF Gaming - Niereferencyjny Ampere

- SPIS TREŚCI -

CHARAKTERYSTYKA ARCHITEKTURY NVIDIA AMPERE

- SPIS TREŚCI -

Powiązane publikacje

Test wydajności Dying Light: The Beast - Nie potrzeba potwora do grania? Wymagania sprzętowe nie straszą... ale są niespodzianki

Test GTA V Enhanced - Analiza jakości obrazu, skalowania DLSS4 i wpływu Frame Generation na opóźnienia systemowe

Test kart graficznych 8 GB vs 16 GB VRAM na przykładzie GeForce RTX 5060 Ti vs Radeon RX 9060 XT. Także na obniżonych detalach

Test Cronos: The New Dawn PC. Jakość technik NVIDIA DLSS 4, AMD FSR 3.1 oraz Intel XeSS 2. Frame Generation i skalowanie wydajności

Test wydajności Cronos: The New Dawn - Dead Space po polsku, czyli za komuny nie było lepiej! Świetna grafika i wysokie wymagania

Komentarze:

Recenzja Dying Light: The Beast - Kyle Crane jest wściekły i niebezpieczny jak nigdy dotąd. Sprawdzamy obiecujący spin-off

Jaki monitor kupić? Polecane monitory do biura i grania na wrzesień 2025. Poradnik zakupowy w różnych przedziałach cenowych

Test wydajności Dying Light: The Beast - Nie potrzeba potwora do grania? Wymagania sprzętowe nie straszą... ale są niespodzianki

Test GTA V Enhanced - Analiza jakości obrazu, skalowania DLSS4 i wpływu Frame Generation na opóźnienia systemowe

Recenzja Borderlands 4 - Gearbox wyprowadza serię z Pandory, dorzuca Unreal Engine 5 i próbuje przywrócić jej dawną chwałę

Ta podatność mogła zniszczyć cały Microsoft Azure. Jeden token wystarczył do przejęcia kontroli nad wszystkimi kontami firm

Apple iPhone Air wytrzymuje nacisk 98 kg podczas testów wytrzymałości przeprowadzonych przez JerryRigEverything

Recenzja Dying Light: The Beast - Kyle Crane jest wściekły i niebezpieczny jak nigdy dotąd. Sprawdzamy obiecujący spin-off

Czy da się kupić karty graficzne AMD Radeon RX 9000 w kwocie MSRP? Sprawdź obecne ceny modeli RDNA 4

Konsole Xbox Series są coraz droższe. Microsoft ogłasza podwyżkę, choć nie dla Polski. Xbox Series X kosztuje już prawie 3000 zł

Test Cronos: The New Dawn PC. Jakość technik NVIDIA DLSS 4, AMD FSR 3.1 oraz Intel XeSS 2. Frame Generation i skalowanie wydajności

Procesor Intel Core i5-14600K BOX plus Battlefield 6 teraz w rewelacyjnie niskiej cenie. Za 649 zł niczego lepszego nie dostaniesz

TOP 10 legendarnych gier, które (nadal) nie otrzymały remake'u lub godnego portu. Na te odświeżenia czekają zwłaszcza milenialsi

Test wydajności Cronos: The New Dawn - Dead Space po polsku, czyli za komuny nie było lepiej! Świetna grafika i wysokie wymagania

Linux z rekordowym udziałem w Polsce i Europie. Alternatywa dla Windowsa nigdy nie była tak popularna

O portalu PurePC

Najważniejsze

Znajdź PurePC na