NVIDIA GeForce RTX 4080 - poznaliśmy szczegóły budowy rdzeni AD103 oraz AD104, które użyto w układach Ada Lovelace
Podczas konferencji GeForce Beyond, NVIDIA skupiła się na prezentacji topowej karty graficznej GeForce RTX 4090. Flagowiec z rodziny Ada Lovelace został wyposażony w układ graficzny Ada AD102, oferujący m.in. ponad 76 miliardów tranzystorów. Nie ujawniono natomiast żadnych konkretnych szczegółów na temat układów AD103 oraz AD104, które napędzają odpowiednio GeForce RTX 4080 16 GB oraz GeForce RTX 4080 12 GB. Teraz poznaliśmy brakujące informacje.
Poznaliśmy szczegóły budowy rdzeni NVIDIA AD103 oraz AD104, które wykorzystane zostały w kartach GeForce RTX 4080 16 GB oraz 12 GB. Okazuje się, że układ AD104 oferuje więcej tranzystorów niż topowy GA102.
NVIDIA GeForce RTX 4000 - charakterystyka kart, szczegóły techniki DLSS 3 oraz kwestia cen teraz i w przyszłości
W sieci pojawiły się już chyba ostatnie szczegóły dotyczące budowy układów graficznych NVIDIA Ada AD103 oraz AD104. Dotychczas skupialiśmy się na topowym AD102, o którym jednak wiemy już wszystko. Co zaś dotyczy AD103 oraz AD104 to nowe informacje potwierdzają, że oba układy graficzne mają zauważalnie mniejszą powierzchnię w porównaniu do odpowiednio GA103 oraz GA104. AD103 ma powierzchnię 378,6 mm² (a więc mniej od GA104 - 392 mm²), z kolei AD104 to stosunkowo niewielki chip o powierzchni 294,5 mm² (zatem niewiele większy od GA106 - 276 mm² oraz dużo mniejszy od wspomnianego GA104). Spora w tym zasługa litografii TSMC "4N (swoją drogą - jest to oznaczenie dla de facto procesu 5 nm, który został usprawniony pod kątem układów graficznych NVIDII). Pomimo zmniejszenia rozmiarów poszczególnych chipów, znacząco zwiększono liczbę tranzystorów. Dla przykładu AD104 ma ich więcej (!) niż topowy Ampere GA102 - mowa o różnicy 35,8 mld (AD104) vs 28,3 mld (GA102).
NVIDIA GeForce RTX 4090 | NVIDIA GeForce RTX 4080 16 GB | NVIDIA GeForce RTX 4080 12 GB | |
Architektura | Ada | Ada | Ada |
Układ graficzny | AD102-300 | AD103-300 | AD104-400 |
Litografia | TSMC "4N" | TSMC "4N" | TSMC "4N" |
Liczba tranzystorów | 76,3 mld | 45,9 mld | 35,8 mld |
Powierzchnia | 608 mm² | 378,6 mm² | 294,5 mm² |
Bloki SM | 128 | 76 | 60 |
Jednostki SP | 16384 | 9728 | 7680 |
Moc FP32 | 82,6 TFLOPS | 49 TFLOPS | 40 TFLOPS |
Rdzenie RT | 128 RT 3. generacji | 76 RT 3. generacji | 60 RT 3. generacji |
Rdzenie Tensor | 512 Tensor 4. generacji | 304 Tensor 4. generacji | 240 Tensor 4. generacji |
Jednostki TMU | 512 | 304 | 240 |
Jednostki ROP | 192 | 112 | 80 |
Pamięć cache L2 | 96 MB | 64 MB | 48 MB |
Taktowanie bazowe | 2230 MHz | 2210 MHz | 2310 MHz |
Taktowanie GPU Boost | 2520 MHz | 2505 MHz | 2610 MHz |
Przepustowość VRAM | 21 Gbps | 22.5 Gbps | 21 Gbps |
Pamięć VRAM | 24 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X |
Szyna pamięci | 384-bit | 256-bit | 192-bit |
Przepustowość | 1008 GB/s | 720 GB/s | 504 GB/s |
Zgodność z PCIe | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
TDP (bazowe) | 450 W | 320 W | 285 W |
TDP (Max) | 660 W | 516 W | 366 W |
Obsługa DLSS 3 | Tak | Tak | Tak |
Cena w złotówkach | 9399 zł | 7049 zł | 5299 zł |
NVIDIA GeForce RTX 4080 12 GB to powinien być GeForce RTX 4070. Źle to wygląda i źle wróży kolejnym generacjom
Pełna rozpiska poszczególnych układów graficznych znajduje się w poniższej tabeli - porównaliśmy parametry AD102, AD103 i AD104 do odpowiednio GA102, GA103 oraz GA104. Tymczasem ostatnia informacja dotyczy możliwego, wysokiego potencjału karty graficznej NVIDIA GeForce RTX 4090 na overclocking. W oficjalnej specyfikacji producent podaje, że zegar rdzenia graficznego wynosi 2520 MHz. Tymczasem na ustawieniach domyślnych, jeszcze bez żadnego OC, karta w grze Cyberpunk 2077 osiągała taktowanie na poziomie od 2800 do 2850 MHz (ostatni screen w newsie). Wygląda na to, że przebicie 3 GHz na rdzeniu w przypadku topowych układów Ada Lovelace nie powinno być jakimś dużym problemem.
NVIDIA AD102 | NVIDIA GA102 | NVIDIA AD103 | NVIDIA GA103 | NVIDIA AD104 | NVIDIA GA104 | |
Architektura | Ada Lovelace | Ampere | Ada Lovelace | Ampere | Ada Lovelace | Ampere |
Powierzchnia | 608 mm² | 628 mm² | 378,6 mm² | 496 mm² | 294,5 mm² | 392 mm² |
Litografia | TSMC "4N' | Samsung 8 nm | TSMC "4N" | Samsung 8 nm | TSMC "4N" | Samsung 8 nm |
Liczba tranzystorów | 76,3 mld | 28,3 mld | 45,9 mld | ~22-23 mld (?) | 35,8 mld | 17,4 mld |
Gęstość upakowania tranzystorów | 125,5 MTr/mm² | 45,1 MTr/mm² | 121,1 MTr/mm² | ~44 MTr/mm² (?) | 121,1 MTr/mm² | 44,39 MTr/mm² |
Jednostki SP | 18432 CUDA FP32 | 10752 CUDA FP32 | 10240 CUDA FP32 | 7680 CUDA FP32 | 7680 CUDA FP32 | 6144 CUDA FP32 |
Jednostki RT | 144 RT 3. generacji | 84 RT 2. generacji | 80 RT 3. generacji | 60 RT 2. generacji | 60 RT 3. generacji | 48 RT 2. generacji |
Jednostki Tensor | 576 Tensor 4. generacji | 336 Tensor 3. generacji | 320 Tensor 4. generacji | 240 Tensor 3. generacji | 240 Tensor 4. generacji | 192 Tensor 3. generacji |
Ilość pamięci | 24 GB GDDR6X (RTX 4090) | 24 GB GDDR6X (RTX 3090 Ti) | 16 GB GDDR6X (RTX 4080 16 GB) | 16 GB GDDR6 (RTX 3080 Ti Mobile) | 12 GB GDDR6X (RTX 4080 12 GB) | 16 GB GDDR6 (RTX 3080 Mobile) |
Szyna pamięci | 384-bit | 384-bit | 256-bit | 256-bit (RTX 3080 Ti Mobile) 320-bit (ogólnie) |
192-bit | 256-bit |