Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
.
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

Test wydajności kart graficznych KFA2 GeForce RTX 3080 Ti HOF i KFA2 GeForce RTX 3080 Ti SG - Podwójne uderzenie Ampere

Sebastian Oktaba | 18-07-2021 11:00 |

Charakterystyka architektury NVIDIA Ampere

Architektura Ampere została gruntownie przebudowana i usprawniona względem Turinga, aczkolwiek rozwija wcześniejsze założenia oraz technologie, którym inżynierowie NVIDII poświęcili ostatnią dekadę. Priorytet stanowiła oczywiście poprawa wydajności sprzętowej akceleracji śledzenia promieni i efektywności DLSS, realizowanych poprzez dedykowane rdzenie (RT Cores i Tensor Cores). Rodzina GeForce RTX 2000 była największym skokiem jakościowym od momentu wprowadzenia zunifikowanych shaderów, które przejęły funkcje vertex i pixel shaderów, stworzonym do renderowania hybrydowego łączącego ray tracing w czasie rzeczywistym oraz tradycyjną rasteryzację. To stosunkowo świeża koncepcja, dlatego GeForce RTX 3000 podąża wcześniej wytyczoną ścieżką, poprawiając szereg techniczny niuansów, wykorzystując do tego między innymi niższy proces litograficzny, GDDR6X czy nowe bloki SM.

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Karty graficzne bazujące na architekturze NVDIA Ampere otrzymały zmodyfikowane bloki SM (Streaming Multiprocessors). Każdy zawiera teraz 128 procesorów CUDA, zatem upakowanie jednostek cieniujących zwiększono dokładnie dwukrotnie, ponieważ Turing dysponował tutaj 64 procesorami CUDA. Ilość jednostek teksturujących i renderujących przypadających na pojedynczy SM Ampere nie uległa natomiast zwiększeniu w stosunku do poprzednika. Podobnie jak wcześniej, ilość bloków SM odpowiada zarazem ilości RT Cores tzn. GeForce RTX 3090 posiadający 82 SM dysponuje także 82 RT Cores. Turing posiadał jednak 8 rdzeni Tensor przypadających na każdy blok SM, podczas gdy Ampere zawiera tylko 4, chociaż nikogo nie powinno dziwić, że NVIDIA znacznie poprawiła ich wydajność (stąd możliwa była redukcja). 

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Układy Ampere otrzymały rdzenie Tensor trzeciej generacji, zajmujące mniej miejsca w strukturze krzemowej lecz znacznie lepiej przystosowane do głębokiego uczenia i wykorzystywania potencjału sieci neuronowej. NVIDIA podaje w swojej dokumentacji, że wydajność nowych tensorów jest prawie trzykrotnie większa od poprzednika. Dlatego zastosowano ich dwukrotnie mniej niż w Turingu - GeForce RTX 3080 posiada zaledwie połowę jednostek jakimi dysponował GeForce RXT 2080 Ti przy identycznej ilości bloków SM. Nowością jest również DLSS 2.1 / Ultra (Deep Learning Super Sampling) dedykowany głównie rozdzielczości 8K oraz GeForce RTX 3090. Sieć neuronowa z pomocą algorytmów sztucznej inteligencji będzie upscalowała obraz z rozdzielczości 2560x1440 do 7680x4320 pikseli. 

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Na potrzeby Ampere wprowadzono też rdzenie RT drugiej generacji, posiadające sprzętowo akcelerowaną funkcję BVH (Bounding Volume Hierarchy) - strukturę do przechowywania i szybkiego wykonywania zapytań dotyczących obiektów w przestrzeni trójwymiarowej. Nowa wersja rdzeni RT zastosowana w architekturze Ampere może również obliczać dokładny punkt zderzenia się promienia z powierzchnią, aby natychmiast oszacować jego dalszą trasę. Dodatkowo, rdzenie RT Ampere przyspieszają inne obliczenia powiązane z efektami graficznymi np. rozmycie ruchu. Żeby to osiągnąć wprowadzono dodatkowy element - blok logiczny - interpolujący pozycje trójkątów z jednostką ich przecięcia.

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

NVIDIA projektując bloki SM Ampere dwukrotnie zwiększyła efektywność operacji FP32 względem Turinga, co wymagało przeprojektowania ścieżki danych (datapath). Pozwoliło to jednak wykonywać obydwa rodzaje operacji (FP32 i INT32) z pełną wydajnością w cyklu zegarowym. Podwojenie ilości procesorów CUDA spowodowało też konieczność zwiększenia przepustowości oraz rozmiaru pamięci podręcznej L1, która w Ampere na każdy blok SM wynosi 128 KB zamiast 64 KB. NVIDIA do produkcji chipów wykorzystała 8 nm litografię Samsunga, charakteryzującą się większym upakowaniem tranzystorów niż litografia 12 nm FFN. Dla rdzenia TU102 (GeForce RTX 2080 Ti) gęstość tranzystorów sięgała 24,7 MTr/mm², podczas gdy Ampere GA102 (GeForce RTX 3080/3090) może się pochwalić wynikiem na poziomie 44,6 MTr/mm². 

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Karty graficzne NVIDIA GeForce RTX 3000 wykorzystują interfejs PCI-Express 4.0, pozostając oczywiście kompatybilne wstecznie z PCI-Express 3.0. Różnice w wydajności na korzyść nowszego standardu mogą wprawdzie występować w wysokich rozdzielczościach, jednak powinny być maksymalnie kilkuprocentowe. Architektura Ampere obsługuje też złączne HDMI 2.1 działające z pełną przepustowością (48 GB/s) razem z funkcją DCS (Display Stream Compression), pozwalając wyświetlić obraz 8K 60 Hz HDR. W kwestii tego ostatniego - wspierany jest 10-bitowy HDR. Funkcja SLI została zarezerwowana wyłącznie dla topowego GeForce RTX 3090, który posiada odpowiednie złącze NVLink, natomiast słabsze modele zostały go pozbawione.

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Ciekawostką wprowadzoną razem z Ampere jest RTX IO, pozwalające na szybszą wymianę danych między układem graficznym i pamięcią masową (SSD). Kompresją oraz dekompresją zajmuje się tutaj bezpośrednio GPU, odciążając jednocześnie procesor centralny i pamięć systemową. Podobne rozwiązanie wprowadzono także w konsolach nowej generacji, a wykorzystuje ono interfejs Microsoft DirectStorage transferujący dane do pamięci karty graficznej. Co takiego to przyniesie? Przede wszystkim lepsze strumieniowanie tekstur w wysokiej rozdzielczości przy bezstratnej kompresji. Kolejnym rozwiązaniem mogącym zmienić oblicze gier komputerowych jest NVDIA Reflex, technologia mająca zapewniać znacznie niższe opóźnienia na poziomie silnika (poprzez SDK), która zostanie zaimplementowana w m.in. Valorant, Fortnite, Apex Legends. Jest też sprzętowa obsługa kodeka AV1. 

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Test karty graficznej NVIDIA GeForce RTX 3080 - Premiera Ampere!	 [nc1]

Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Sebastian Oktaba
Liczba komentarzy: 32

Komentarze:

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.