Premiera kart graficznych NVIDIA GeForce RTX 5090 Blackwell, to naprawdę długo wyczekiwane wydarzenie, bowiem poprzednia seria debiutowała w październiku 2022 roku. Najnowsza generacja wzbudziła trochę uzasadnionych kontrowersji, ponieważ producent zamiast zwiększenia czystej wydajności, położył większy nacisk na rozwiązania wykorzystujące sztuczną inteligencję, algorytmy głębokiego uczenia i zaawansowany generator klatek. NVIDIA GeForce RTX 5090 oczywiście otrzymał solidny zastrzyk surowej mocy obliczeniowej, jednak topowy Blackwell nie powtórzy gigantycznego skoku dokonanego między NVIDIA GeForce RTX 4090 i GeForce RTX 3090 Ti. Zatem co potrafi najszybsza i najdroższa konsumencka karta graficzna?

Autor: Sebastian Oktaba

Architektura NVIDIA Blackwell wprowadza zmodyfikowane bloki SM względem Ada Lovelace, głównie w kontekście budowy shaderów. Poprzednik posiadał 64 jednostki arytmetyczne dla obliczeń FP32 oraz 64 jednostki umożliwiające przeprowadzanie obliczeń FP32 i INT32, natomiast teraz otrzymujemy 128 jednostek arytmetycznych działających w zakresie FP32 i INT32. Blackwell wspiera również funkcję SER, czyli Shader Execution Reordering, umożliwiającą efektywne zarządzanie shaderami w obliczeniach związanych ze śledzeniem promieni. Rdzenie RT 4. generacji potrafią obliczyć dwukrotnie więcej przecięć promieni w porównaniu do rdzeni RT 3. generacji, natomiast zamiast silnika Triangle Intersection wprowadzony został Triangle Cluster, zoptymalizowano pod kątem efektywniejszego wykorzystania technologii Mega Geometry. Usprawniono także rdzenie Tensor 5. generacji, mogące wykonywać obliczenia FP4, a dodatkowo dostarczać części zasobów obliczeniowej do neuronowych shaderów. Nowe jednostki obsługują również Multi Frame Generation, jako najważniejszą nowość techniki DLSS 4. Więcej o architekturze NVIDIA Blackwell możecie przeczytać w osobnym opracowaniu.

NVIDIA GeForce RTX 5090 przynosi wiele zmian w architekturze, budowie jednostek cieniujących i wprowadza sporo nowinek technologicznych. Jednak czy będzie to miało wystarczająco duże przełożenie na wydajność?

Najpotężniejsza odmiana Blackwella w postaci rdzenia GB202-400-A1 została wykonana w procesie TSMC 4N, zajmuje powierzchnię blisko 750 mm² oraz zawiera 92 miliardy tranzystorów, nieznacznie ustępując rozmiarami wyłącznie monstrualnemu TU102-300A napędzającemu NVIDIA GeForce RTX 2080 Ti. Zdecydowanie większa gęstość pozwoliła zmieścić wewnątrz rekordowe 21760 jednostek cieniujących (CUDA), 680 jednostek teksturujących, 192 jednostki renderujące, 170 jednostek akcelerujących śledzenie promieni i jeszcze 680 jednostek Tensor. Praktycznie we wszystkich aspektach Blackwell przewyższa topową odmianę Ada Lovelace, jednak poszczególne sekcje zostały zmodyfikowane oraz usprawnione, co powinno dodatkowo poprawić wzrost wydajności. Znacznie podskoczył niestety współczynnik TGP, wynoszący astronomiczne 575 W względem skromnych 450 W wystarczających flagowcom poprzednik generacji. Wśród nowości znalazł się interfejs PCI-Express 5.0 x16, którego wprowadzenie jest zasadniczo nieodczuwalne w przypadku wydajności w grach komputerowych.

GeForce RTX 5090 GeForce RTX 4090 GeForce RTX 3090 Ti Architektura Blackwell Ada Lovelace Ampere Rdzeń GB202 AD102 GA102 Litografia 5 nm 5 nm 8 nm Rozmiar 744 mm² 608 mm² 628 mm² Tranzystory 92 mld 76 mld 28 mld Jednostki SP 21760 16384 10752 Jednostki TMU 680 512 336 Jednostki ROP 192 192 112 Jednostki RT 170 128 84 Jednostki AI 680 512 336 Taktowanie bazowe 2010 MHz 2235 MHz 1560 MHz Taktowanie boost 2410 MHz 2520 MHz 1860 MHz Taktowanie pamięci 28000 MHz 21200 MHz 21000 MHz Ilość pamięci 32 GB GDDR7 24 GB GDDR6X 24 GB GDDR6X Szyna pamięci 512-bit 384-bit 384-bit Przepustowość 1792 GB/s 1020 GB/s 1000 GB/s Interfejs PCI-E 5.0 x16 PCI-E 4.0 x16 PCI-E 4.0 x16 Współczynnik TGP 575 W 450 W 450 W Cena MSRP 1999 USD 1599 USD 1999 USD

Największą stricte techniczną zmianą w stosunku do odpowiedników poprzedniej generacji jest wstawienie 32 GB pamięci GDDR7 zamiast 24 GB GDDR6X, której jednocześnie poszerzono magistralę do 512-bitów względem 384-bitowej. Jako ciekawostkę można wspomnieć, że ostatnia konsumencka karta graficzna NVIDIA posiadająca taką konfigurację, to GeForce GTX 285 wprowadzony pod koniec 2008 roku. Pozwoliło to uzyskać imponujący wzrost przepustowości do 1792 GB/s, podczas gdy NVIDIA GeFoce RTX 4090 zapewniał 1020 GB/s. Pytacie zaskoczeni - komu potrzebne podobne wartości? Odpowiem w sposób następujący - NVIDIA GeForce RTX 5090 to produkt skierowany do twórców wykorzystujących aplikacje kreatywne, sztuczną inteligencję czy zwyczajnie renderujących. Flagowce oczywiście interesują najbardziej wymagających oraz zagorzałych graczy, zwłaszcza tych celujących w nowinki technologiczne, jednak raczej niewielki procent faktycznie będzie skłonny wysupłać 2000 dolarów. Ponownie zatem wychodzi, że NVIDIA GeForce RTX 5090 to tańsza odmiana kart graficznych Titan.