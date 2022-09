O kartach graficznych NVIDIA GeForce RTX 4000 dosłownie rozpisywaliśmy się przez ostatnie dwa dni. Nie da się bowiem ukryć, że prezentacja NVIDII o nazwie GeForce Beyond odbiła się szerokim echem w Internecie. Nie tylko przez wzgląd na oferowaną wydajność, ale również kontrowersje związane z kartą GeForce RTX 4080 oraz wycenę za poszczególne modele. Wczoraj przez większość dnia braliśmy udział z spotkaniu z NVIDIĄ (Editor's Day), podczas którego prezentowano możliwości kart oraz techniki DLSS. Nie zabrakło również spotkania z prezesem NVIDII - Jensenem Huangiem, podczas którego podniesiony został temat cen obecnych oraz przyszłych układów GPU.

Podczas NVIDIA Editor's Day, poznaliśmy szereg szczegółów na temat kart graficznych GeForce RTX 4000 oraz techniki DLSS 3. Ponadto podczas spotkania z Jensenem Huangiem została podniesiona kwestia cen za obecne i przyszłe układy graficzne. Mówiąc krótko - tanio już było.

Wczorajsze spotkanie obfitowało przede wszystkim w informacje, które były już mniej lub bardziej szczegółowo omówione dzień wcześniej, czy to bezpośrednio na konferencji GTC 2022 czy również poprzez informacje zawarte już na stronie NVIDII. Producent przekazał kilka dodatkowych informacji o kartach graficznych GeForce RTX 4000. Uzyskaliśmy finalne potwierdzenie, że początkowo wykorzystano trzy układy graficzne Ada Lovelace: AD102-300 (GeForce RTX 4090), AD103-300 (GeForce RTX 4080 16 GB) oraz AD104-400 (GeForce RTX 4080 12 GB). Potwierdzono również schemat blokowy układu AD102 - jedną z kluczowych zmian jest znaczące powiększenie pamięci cache L2 względem Ampere oraz rozbudowa rdzeni RT oraz Tensorów, odpowiednio 3 i 4. generacji. Bloki SM nie uległy jakimś znaczącym zmianom, a same procesory CUDA FP32 to w gruncie rzeczy dopakowane CUDA z architektury Ampere. Potwierdzono również wygląd płytki PCB dla karty graficznej NVIDIA GeForce RTX 4090 Founders Edition. Ma podobnie kompaktowy rozmiar, gdzie znajdziemy na nim m.in. 23-fazową sekcję zasilania. Sama karta Founders Edition na pierwszy rzut oka ma zbliżony wygląd, ale wprowadzono pewne usprawnienia. Większe wentylatory mają przyczynić się do lepszego o 20% przepływu powietrza. Częścią chłodzenia jest rozbudowana komora parowa. Lepiej mają być także chłodzone kości GDDR6X. NVIDIA podkreśliła również, że tym razem zamontowano modele o niższym poborze energii, a same temperatury mają być lepiej monitorowane przez większy zestaw czujników.

NVIDIA GeForce RTX 4090 NVIDIA GeForce RTX 4080 16 GB NVIDIA GeForce RTX 4080 12 GB Architektura Ada Ada Ada Układ graficzny AD102-300 AD103-300 AD104-400 Litografia TSMC "4N" TSMC "4N" TSMC "4N" Liczba tranzystorów 76 mld ? ? Powierzchnia 608 mm² 380 mm² (?) ? Bloki SM 128 76 60 Jednostki SP 16384 9728 7680 Moc FP32 82,6 TFLOPS 49 TFLOPS 40 TFLOPS Rdzenie RT 128 RT 3. generacji 76 RT 3. generacji 60 RT 3. generacji Rdzenie Tensor 512 Tensor 4. generacji 304 Tensor 4. generacji 240 Tensor 4. generacji Jednostki TMU 512 304 240 Jednostki ROP 192 96 (?) 96 (?) Taktowanie bazowe 2230 MHz 2210 MHz 2310 MHz Taktowanie GPU Boost 2520 MHz 2505 MHz 2610 MHz Przepustowość VRAM 21 Gbps 22.5 Gbps 21 Gbps Pamięć VRAM 24 GB GDDR6X 16 GB GDDR6X 12 GB GDDR6X Szyna pamięci 384-bit 256-bit 192-bit Przepustowość 1008 GB/s 720 GB/s 504 GB/s Zgodność z PCIe PCIe 4.0 x16 PCIe 4.0 x16 PCIe 4.0 x16 TDP (bazowe) 450 W 320 W 285 W TDP (Max) 660 W 516 W 366 W Obsługa DLSS 3 Tak Tak Tak Cena w złotówkach 9399 zł 7049 zł 5299 zł

Każdy z bloków Streaming Multiprocessor posiada 128 KB pamięci podręcznej L1. Pełny układ AD102 ze 144 blokami SM posiada zatem 18 MB cache L1. W przypadku pamięci L2, rdzeń AD102 oferuje 96 MB tejże pamięci, co jest wartością 16-krotnie większą w porównaniu do układu Ampere GA102 (6 MB L2). Dzięki procesowi TSMC "4N", będącej niestandardową wersją TSMC N5 dla układów NVIDII, efektywność energetyczna nowych kart zwiększyła się dwukrotnie w porównaniu do modeli GeForce RTX 3000, które korzystały z 8 nm procesu Samsunga.

Karty graficzne NVIDIA GeForce RTX 4000 obsługują także najnowszą wersję techniki DLSS - DLSS 3 - którego fundamentem pozostaje jednak DLSS 2. Oznacza to, że posiadacze kart GeForce RTX 3000 oraz GeForce RTX 2000 będą mogli w dalszym ciągu korzystać z DLSS 2 (sprzężonym z NVIDIA Reflex) w tych grach, w których Deep Learing Super Sampling będzie zaimplementowany. Posiadacze układów Ada Lovelace mogą natomiast skorzystać z dodatkowych funkcji, wśród których najważniejszą będzie DLSS Frame Generation. Funkcja ta napędzana jest usprawniony akcelerator Optical Flow (jest on obecny także w Tensorach 2 i 3. generacji, ale będący prymitywną wersją tego, co przygotowano w 4. generacji i jest to główny powód, dla którego NVIDIA zdecydowała się nie dodać wsparcia dla Frame Generation w starszych wersjach kart GeForce RTX), będący częścią Tensorów 4. generacji. Zadaniem akceleratora Optical Flow jest przekazywanie danych o ruchu pikseli z kolejnych klatek do sieci neuronowej DLSS, generując kolejne klatki na układzie GPU, co ma wpływać na zauważalne zwiększenie wydajności w scenariuszach, gdzie to procesor odgrywa istotną rolę.

Optical Flow Accelerator analizuje również dwie sekwencyjne klatki gry i oblicza na ich podstawie pole przepływu optycznego, które z kolei rejestruje kierunek i prędkość, z jaką piksele poruszają się od jednej do drugiej klatki obrazu. Akcelerator ten dzięki temu jest w stanie wychwycić informacje na poziomie pikseli o takich elementach grafiki jak efekty cząsteczkowe, odbicia, cienie oraz oświetlenie, które nie są uwzględniane w obliczeniach wektora ruchu. Ogólnie rzecz biorąc, DLSS rekonstruuje pierwszą klatkę na poziomie 75%, z kolei druga klatka jest w pełni zrekonstruowana, za co odpowiada funkcja Frame Generation). Finalnie DLSS 3 jest w stanie zrekonstruować łącznie 7/8 z obu klatek - wpływa to na jeszcze wierniejsze odwzorowanie obrazu oraz dalszy przyrost wydajności. Dodatkowo w DLSS zaszyta będzie inna funkcja NVIDII - Reflex - której działanie ma maksymalnie zminimalizować opóźnienie sygnału wyjściowego (input lag). Na przykładzie Cyberpunka 2077 pokazano, że input lag w wersji DLSS 3 jest o kilka milisekund niższy w porównaniu do DLSS 2, a sama wydajność jest jeszcze wyższa. Oczywiście zapewnienia NVIDII w tym temacie brzmią pięknie, ale dopiero niezależne testy pokażą jak DLSS 3 sprawdzi się w rzeczywistości. Przy okazji potwierdzono, że z DLSS 3 skorzysta także Mavel's Spider-Man Remastered. Aktualizacja powinna pojawić się w przyszłym miesiącu, już po debiucie GeForce RTX 4090.

Schemat blokowy układu NVIDIA AD102 - kliknij na zdjęcie, aby wyświetlić w pełnym rozmiarze:

Ostatnią kwestią wartą poruszenia pozostaje cena kart graficznych. Podczas rozmowy z Jensenem Huangiem, prezes NVIDII dał jasno do zrozumienia, że skończyły się czasy, gdy w tej samej cenie oferowane były układy dające dwukrotnie wyższą wydajność. Coraz bardziej skomplikowany proces produkcji układów GPU (wg. Jensena prawo Moore'a właściwie już umarło) oraz bardzo wysokie koszty wafli krzemowych przekładają się (i będą przekładać się w przyszłości) na jeszcze wyższe ceny. Jednocześnie nie ma również co liczyć na zauważalne spadki cen obecnych układów graficznych. CEO NVIDII podkreśla, że obecne chipy Ada Lovelace w tej samej cenie co wcześniejsze modele oferują zauważalnie wyższą wydajność, więc w sumie powinniśmy się cieszyć że ceny są takie jakie są, a nie na jeszcze wyższym poziomie. Wypowiedź prezesa sugeruje także, że kolejne generacje będą miały ceny jeszcze bardziej windowane w górę, co w konsekwencji będzie prowadzić do dalszego przesuwania półek wydajnościowych.

Źródło: NVIDIA, PurePC