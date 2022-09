Podczas konferencji GeForce Beyond, NVIDIA skupiła się na prezentacji topowej karty graficznej GeForce RTX 4090. Flagowiec z rodziny Ada Lovelace został wyposażony w układ graficzny Ada AD102, oferujący m.in. ponad 76 miliardów tranzystorów. Nie ujawniono natomiast żadnych konkretnych szczegółów na temat układów AD103 oraz AD104, które napędzają odpowiednio GeForce RTX 4080 16 GB oraz GeForce RTX 4080 12 GB. Teraz poznaliśmy brakujące informacje.

W sieci pojawiły się już chyba ostatnie szczegóły dotyczące budowy układów graficznych NVIDIA Ada AD103 oraz AD104. Dotychczas skupialiśmy się na topowym AD102, o którym jednak wiemy już wszystko. Co zaś dotyczy AD103 oraz AD104 to nowe informacje potwierdzają, że oba układy graficzne mają zauważalnie mniejszą powierzchnię w porównaniu do odpowiednio GA103 oraz GA104. AD103 ma powierzchnię 378,6 mm² (a więc mniej od GA104 - 392 mm²), z kolei AD104 to stosunkowo niewielki chip o powierzchni 294,5 mm² (zatem niewiele większy od GA106 - 276 mm² oraz dużo mniejszy od wspomnianego GA104). Spora w tym zasługa litografii TSMC "4N (swoją drogą - jest to oznaczenie dla de facto procesu 5 nm, który został usprawniony pod kątem układów graficznych NVIDII). Pomimo zmniejszenia rozmiarów poszczególnych chipów, znacząco zwiększono liczbę tranzystorów. Dla przykładu AD104 ma ich więcej (!) niż topowy Ampere GA102 - mowa o różnicy 35,8 mld (AD104) vs 28,3 mld (GA102).

NVIDIA GeForce RTX 4090 NVIDIA GeForce RTX 4080 16 GB NVIDIA GeForce RTX 4080 12 GB Architektura Ada Ada Ada Układ graficzny AD102-300 AD103-300 AD104-400 Litografia TSMC "4N" TSMC "4N" TSMC "4N" Liczba tranzystorów 76,3 mld 45,9 mld 35,8 mld Powierzchnia 608 mm² 378,6 mm² 294,5 mm² Bloki SM 128 76 60 Jednostki SP 16384 9728 7680 Moc FP32 82,6 TFLOPS 49 TFLOPS 40 TFLOPS Rdzenie RT 128 RT 3. generacji 76 RT 3. generacji 60 RT 3. generacji Rdzenie Tensor 512 Tensor 4. generacji 304 Tensor 4. generacji 240 Tensor 4. generacji Jednostki TMU 512 304 240 Jednostki ROP 192 112 80 Pamięć cache L2 96 MB 64 MB 48 MB Taktowanie bazowe 2230 MHz 2210 MHz 2310 MHz Taktowanie GPU Boost 2520 MHz 2505 MHz 2610 MHz Przepustowość VRAM 21 Gbps 22.5 Gbps 21 Gbps Pamięć VRAM 24 GB GDDR6X 16 GB GDDR6X 12 GB GDDR6X Szyna pamięci 384-bit 256-bit 192-bit Przepustowość 1008 GB/s 720 GB/s 504 GB/s Zgodność z PCIe PCIe 4.0 x16 PCIe 4.0 x16 PCIe 4.0 x16 TDP (bazowe) 450 W 320 W 285 W TDP (Max) 660 W 516 W 366 W Obsługa DLSS 3 Tak Tak Tak Cena w złotówkach 9399 zł 7049 zł 5299 zł

Pełna rozpiska poszczególnych układów graficznych znajduje się w poniższej tabeli - porównaliśmy parametry AD102, AD103 i AD104 do odpowiednio GA102, GA103 oraz GA104. Tymczasem ostatnia informacja dotyczy możliwego, wysokiego potencjału karty graficznej NVIDIA GeForce RTX 4090 na overclocking. W oficjalnej specyfikacji producent podaje, że zegar rdzenia graficznego wynosi 2520 MHz. Tymczasem na ustawieniach domyślnych, jeszcze bez żadnego OC, karta w grze Cyberpunk 2077 osiągała taktowanie na poziomie od 2800 do 2850 MHz (ostatni screen w newsie). Wygląda na to, że przebicie 3 GHz na rdzeniu w przypadku topowych układów Ada Lovelace nie powinno być jakimś dużym problemem.

NVIDIA AD102 NVIDIA GA102 NVIDIA AD103 NVIDIA GA103 NVIDIA AD104 NVIDIA GA104 Architektura Ada Lovelace Ampere Ada Lovelace Ampere Ada Lovelace Ampere Powierzchnia 608 mm² 628 mm² 378,6 mm² 496 mm² 294,5 mm² 392 mm² Litografia TSMC "4N' Samsung 8 nm TSMC "4N" Samsung 8 nm TSMC "4N" Samsung 8 nm Liczba tranzystorów 76,3 mld 28,3 mld 45,9 mld ~22-23 mld (?) 35,8 mld 17,4 mld Gęstość upakowania tranzystorów 125,5 MTr/mm² 45,1 MTr/mm² 121,1 MTr/mm² ~44 MTr/mm² (?) 121,1 MTr/mm² 44,39 MTr/mm² Jednostki SP 18432 CUDA FP32 10752 CUDA FP32 10240 CUDA FP32 7680 CUDA FP32 7680 CUDA FP32 6144 CUDA FP32 Jednostki RT 144 RT 3. generacji 84 RT 2. generacji 80 RT 3. generacji 60 RT 2. generacji 60 RT 3. generacji 48 RT 2. generacji Jednostki Tensor 576 Tensor 4. generacji 336 Tensor 3. generacji 320 Tensor 4. generacji 240 Tensor 3. generacji 240 Tensor 4. generacji 192 Tensor 3. generacji Ilość pamięci 24 GB GDDR6X (RTX 4090) 24 GB GDDR6X (RTX 3090 Ti) 16 GB GDDR6X (RTX 4080 16 GB) 16 GB GDDR6 (RTX 3080 Ti Mobile) 12 GB GDDR6X (RTX 4080 12 GB) 16 GB GDDR6 (RTX 3080 Mobile) Szyna pamięci 384-bit 384-bit 256-bit 256-bit (RTX 3080 Ti Mobile)

320-bit (ogólnie) 192-bit 256-bit

