NVIDIA GeForce RTX 3000: nowe informacje o architekturze Ampere
Kilka dni temu zostały zaprezentowane karty graficzne NVIDIA GeForce RTX 3000 - z pewnością jest to nie tylko najważniejsze wydarzenie w naszej w branży w ciągu tego tygodnia ale również jedno z najważniejszych w tym roku. Nowa generacja oparta na architekturze Ampere zapowiada się jako udana seria GPU z dużym wzrostem wydajności względem poprzedników (Turing) nie tylko w rasteryzacji ale także z aktywnym Ray Tracingiem oraz DLSS. Ponadto NVIDIA zapowiedziała topową kartę GeForce RTX 3090, która reklamowana jest jako pierwsze GPU przygotowane z myślą o graniu w rozdzielczości 8K. Podczas wirtualnych prezentacji odbywających się w sieci, firma nie omieszkała podzielić się kolejnymi szczegółami dotyczącymi architektury Ampere oraz specyfikacji poszczególnych kart.
NVIDIA podzieliła się nowymi szczegółami dotyczącymi architektury Ampere oraz specyfikacji kart graficznych GeForce RTX 3000.
Karty graficzne NVIDIA GeForce RTX 3000. Polskie ceny i specyfikacja
NVIDIA potwierdziła sporo informacji na temat architektury Ampere i jednocześnie podzieliła się nowymi szczegółami, które nie zostały ujawnione w dniu prezentacji. Producent do produkcji chipów wykorzystał proces technologiczny 8 nm od Samsunga, który charakteryzuje się dużo większym upakowaniem tranzystorów na każdy mm². W przypadku Turinga i rdzenia TU102 (RTX 2080 Ti) gęstość upakowania tranzystorów sięgała 24,7 MTr/mm², z kolei rdzeń Ampere GA102 (RTX 3080/3090) ma gęstość na poziomie 44,6 MTr/mm². Większy GA102 ma powierzchnię 628 mm² (28 miliardów tranzystorów), podczas gdy mniejszy rdzeń Ampere GA104 (RTX 3070) ma powierzchnię 392 mm² przy 17,4 miliardach tranzystorów. O ile więc GA102 jest tylko nieco większe od Turing TU104 i dużo mniejsze od TU102, tak GA104 jest mniejsze nie tylko od rdzenia TU104 (545 mm²) ale i od TU106 (445 mm²).
Specyfikacja | GeForce RTX 2080 Ti | GeForce RTX 3070 | GeForce RTX 3080 | GeForce RTX 3090 |
Architektura, rdzeń | Turing, TU102 12 nm TSMC |
Ampere, GA104 8 nm Samsung |
Ampere, GA102 8 nm Samsung |
Ampere, GA102 8 nm Samsung |
Powierzchnia | 754 mm² | 392 mm² | 628 mm² | 628 mm² |
Ilość tranzystorów | 18,6 mld | 17,4 mld | 28 mld | 28 mld |
Ilość bloków SM | 68 | 46 | 68 | 82 |
Rdzenie CUDA | 4352 | 5888 | 8704 | 10496 |
Rdzenie Tensor | 544 (8 na SM) | 184 (4 na SM) | 272 (4 na SM) | 328 (4 na SM) |
Rdzenie RT | 68 | 46 | 68 | 82 |
TFLOPS (FP32) | 13,4 TFLOPS | 20,3 TFLOPS | 29,8 TFLOPS | 35,6 TFLOPS |
TFLOPS (RT) | 110 TFLOPS | 163 TFLOPS | 238 TFLOPS | 285 TFLOPS |
Taktowanie bazowe | 1350 MHz | 1500 MHz | 1440 MHz | 1395 MHz |
Taktowanie GPU Boost | 1545 MHz | 1725 MHz | 1710 MHz | 1650 MHz |
Pamięć VRAM | 11 GB GDDR6 | 8 GB GDDR6 | 10 GB GDDR6X | 24 GB GDDR6X |
Taktowanie pamięci | 14000 MHz | 14000 MHz | 19000 MHz | 19500 MHz |
Przepustowość | 616 GB/s | 448 GB/s | 760 GB/s | 937 GB/s |
Magistrala pamięci | 352-bit | 256-bit | 320-bit | 384-bit |
TGP | 250 W | 220 W | 320 W | 350 W |
NVIDIA GeForce RTX 3000. Najwydajniejsze karty graficzne Ampere
NVIDIA zaprezentowała również płytkę PCB karty GeForce RTX 3080 - tak jak już wiemy od pewnego czasu nowa płytka dla edycji Founders Edition odznacza się niewielkim rozmiarem oraz gęsto upakowanymi elementami tj. pamięć VRAM oraz zasilanie. Ten konkretny model posiada 10 kości pamięci GDDR6X (1 GB każdy) oraz 18-fazową sekcję zasilania. W przeciwieństwie do GeForce'a RTX 3090 brakuje nie tylko pozostałych kości pamięci, ale także mostku NVLink - ten jest obecny wyłącznie w topowej karcie i tylko RTX 3090 w nowej generacji wspiera technologię SLI. Płytka PCB ma również nieregularny kształt, ale dotyczy to tylko wersji Founders Edition. Nowe karty mają odznaczać się dużo wyższą wydajnością w porównaniu do swoich poprzedników. NVIDIA zaprezentowała kilka slajdów porównujących wybrane karty graficzne. GeForce RTX 3070 ma oferować średnio 60% wyższą wydajność w porównaniu do RTX 2070 w rozdzielczości 2560x1440 pikseli. GeForce RTX 3080 w rozdzielczości 4K ma z kolei osiągać nawet dwukrotnie wyższą wydajność w porównaniu do RTX 2080. Na bazie topowego RTX 3090 NVIDIA pokazuje z kolei, że będzie to dużo lepsze GPU od TITAN RTX.
Architektura Ampere posiada również rdzenie Tensor 3 generacji, które mają sobie jeszcze lepiej radzić z głębokim uczeniem. Wraz z premierą nowych kart, producent wprowadzi również DLSS 2.1, który będzie wykorzystywany głównie z wysokiej rozdzielczości 8K przez kartę GeForce RTX 3090. Sieć neuronowa będzie upscalowała obraz z rozdzielczości 2560x1400 pikseli do 7680x4320 pikseli - nowy DLSS 2.1 ma zatem oferować 9-krotnie zwiększenie rozdzielczości z pomocą algorytmów sztucznej inteligencji, tym samym pozwalając z zgodnych z tą techniką grach osiągać płynność minimum 60 FPS (a często dużo więcej). Sama budowa rdzeni Tensor jest zbliżona do tego co zaprezentowała NVIDIA na przykładzie akceleratora A100 i różni się tym samym od tego co oferował Turing. Rdzeni jest mniej (4 na każdy blok SM zamiast 8 jak w architekturze Turing), ale każdy z nich jest dużo wydajniejszy i efektywniejszy od poprzedników. Zajmują również mniej miejsca w rdzeniu graficznym.
Karty graficzne oparte na architekturze Ampere posiadają również udoskonalone rdzenie RT (RT drugiej generacji) - podobnie jak w architekturze Turing na każdy blok SM przypada jeden rdzeń RT. Nowe rdzenie posiadają sprzętowo akcelerowaną funkcję BVH (Bounding volume hierarchy - drzewo brył ograniczających – struktura danych do przechowywania i szybkiego wykonywania zapytań dotyczących obiektów w przestrzeni trójwymiarowej). Rdzenie RT przykładowo mogą teraz obliczać dokładny punkt, w którym promień zderzy się z powierzchnią, tak aby możliwe było od razu oszacować jego dalszą trasę. Nowe rdzenie RT mają nie tylko przyspieszyć nie tylko sprzętową akcelerację Ray Tracingu, ale także inne obliczenia powiązane z efektami graficznymi tj. rozmycie w ruchu (Motion Blur). W tym celu rdzenie RT mają dodany dodatkowy element - blok logiczny, który interpoluje pozycje trójkątów wzdłuż skali czasu w koordynacji z jednostką przecięcia trójkątów. Według producenta, rozwiązanie takie jest przydatne do generowania efektów rozmycia ruchu w Ray Tracingu w czasie rzeczywistym.
Powiązane publikacje

Nowe sterowniki do kart graficznych Intel Arc Battlemage poprawiają wydajność w wielu popularnych grach komputerowych
1
ASUS ROG Astral GeForce RTX 5080 DOOM Edition to limitowana karta graficzna dla fanów gry DOOM: The Dark Ages
39
NVIDIA GeForce RTX 5070 Ti - Podkręcono pamięć karty graficznej. Kości GDDR7 od SK hynix osiągnęły 34 Gb/s
188
ASUS GeForce RTX 5000 ROG Astral - karty graficzne Blackwell, które posiadają akcelerometr i żyroskop
90