Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
.
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

Test karty graficznej NVIDIA GeForce RTX 4090 - Kosmiczna wydajność w kosmicznej cenie. Mocna premiera!

Sebastian Oktaba | 11-10-2022 15:00 |

Test NVIDIA GeForce RTX 4090 - Architektura Ada Loveace

Architektura Ada Lovelace jest wyraźnie ukierunkowana na zwiększenie wydajności w śledzeniu promieni, bo chociaż klasyczna rasteryzacja również otrzymała solidne przyspieszenie, to właśnie ray tracing wymaga ciągłego pompowania mocy obliczeniowej. Można w pewnym uproszczeniu nazwać Ada Lovelace wersją rozwojową Ampere, ponieważ budowa głównych bloków jest bardzo podobna, natomiast poważniejszych zmian dokonano w strukturze jednostek RT i Tensor. Pełny układ AD102 może zawierać 12 bloków GPC, integrujących wszystkie jednostki obliczeniowe, komunikując się bezpośrednio z podsystemem pamięci. GeForce RTX 4090 wykorzystuje 11 bloków, więc zostaje jeszcze miejsce na GeForce RTX 4090 Ti.

Test karty graficznej NVIDIA GeForce RTX 4090 - Kosmiczna wydajność w kosmicznej cenie. Mocna premiera! [nc1]

Seria GeForce RTX 4000 korzysta z nowego procesu technologicznego 5 nm autorstwa TSMC, który na zbliżonej powierzchni do poprzedników pozwala upchnąć ponad dwukrotnie więcej tranzystorów (28 vs 76 miliardów). Dzięki zmianie litografii radykalnie podniesiono też taktowania rdzenia. Podsystem pamięci w topowych modelach pozostał jednak praktycznie niezmieniony. Ilość pamięci Cache L1 również nie uległa zwiększeniu (128 KB ba blok SM), natomiast strukturę Cache L2 całkowicie przebudowano. Zamiast 6 MB dostępnego dla Ampere, Ada Lovelace dysponuje 96 MB Cache L2, co zdaniem inżynierów wymiernie wpłynie na wydajność w złożonych operacjach patch i ray tracingu.

Test karty graficznej NVIDIA GeForce RTX 4090 - Kosmiczna wydajność w kosmicznej cenie. Mocna premiera! [nc1]

Test karty graficznej NVIDIA GeForce RTX 4090 - Kosmiczna wydajność w kosmicznej cenie. Mocna premiera! [nc1]

Ada Lovelace wprowadza rdzenie RT trzeciej generacji, które powinny oferować dwukrotny wzrost efektowności obliczeniowej w przecięciach promienia światła z trójkątem, będących podstawą techniki ray tracingu. Swoiste kolejkowanie rozkazów NVIDIA nazwała Shader Execution Reordering (SER). Sprzętowo śledzenie promieni będzie teraz realizowane m.in. przez zupełnie nowe jednostki obliczeniowe, które usprawniają cały proces generowania obrazu. Wśród najważniejszych usprawnień znalazł się silnik Opacity Micromap oraz DMM (Displaced Micro-Meshes), obydwa będące integralną częścią rdzeni RT wprowadzonych w Ada Lovelace.

Test karty graficznej NVIDIA GeForce RTX 4090 - Kosmiczna wydajność w kosmicznej cenie. Mocna premiera! [nc1]

Silnik DMM oddelegowano do generowania mikro-trójkątów z mikro-siatki, które są nowym  prymitywem, czyli prostymi figurami geometrycznymi z jakich buduje się złożone obiekty i bardziej skomplikowane struktury. Rdzenie RT trzeciej generacji przetwarzają takie polecenia natywnie. DMM w założeniach powinno 10-krotnie przyspieszyć tworzenie struktur BVH, jednocześnie zajmując 20-krotnie mniej pamięci graficznej. Od strony technicznej DMM wykorzystuje prostą BVH, jeden bazowy trójkąt i mapę przemieszczeń, aby stworzyć wysoce szczegółową siatkę geometryczną z mniejszą ilością wymaganych zasobów.

Test karty graficznej NVIDIA GeForce RTX 4090 - Kosmiczna wydajność w kosmicznej cenie. Mocna premiera! [nc1]

Drugie fundamentalne usprawnienie, to wprowadzenie silnika Opacity Micromap (mikro-mapy krycia) przeznaczonego do bezpośredniego testowania geometrii alfa i znacząco redukującego obliczenia alfa oparte na shaderach. Programiści często używają kanału alfa do ekonomicznego wycinania złożonych lub półprzezroczystych obiektów. Dzięki tej funkcjonalności mogą teraz zwięźle opisywać niektóre elementy np.: paprocie czy płoty, a także bezpośrednio i bardziej efektywnie śledzić obiekty za pomocą wyspecjalizowanych rdzeni. Dzięki poczynionym usprawnieniom NVIDIA szacuje nawet 2-4 krotny wzrost wydajności ray tracingu, chociaż dotyczy to określonych scenariuszy. Rdzenie RT architektury Ada Lovelace mają wydajność 200 TFLOPS w porównaniu do 78 TFLOPS w architekturze Ampere.

Test karty graficznej NVIDIA GeForce RTX 4090 - Kosmiczna wydajność w kosmicznej cenie. Mocna premiera! [nc1]

Nowa architektura NVIDII dostała również rdzenie Tensor czwartej generacji, które zoptymalizowano na potrzeby DLSS 3, techniki dostępnej tylko dla układów GeForce RTX 4000. Wśród nowości sprzętowych znalazł się między innymi Optical Flow Accelerator (OFA), przekazujący informacje o pozornym ruch pikseli z kolejnych klatek do sieci neuronowej, co pozwala przygotować klatki przed ich faktycznym wyświetleniem. Powinno to znacznie zwiększyć efektywność DLSS 3 względem poprzednich iteracji, zwłaszcza w scenariuszach gdzie wąskim gardłem jest procesor. Wymaga to jednak nie tylko zgodnego hardware, ale również odpowiednich kompilacji oprogramowania, bo zasada działania DLSS 3 jest tutaj inna.

Test karty graficznej NVIDIA GeForce RTX 4090 - Kosmiczna wydajność w kosmicznej cenie. Mocna premiera! [nc1]

Optical Flow Accelerator analizuje dwie sekwencyjne klatki obliczając pole przepływu optycznego, które z kolei rejestruje kierunek i prędkość pikseli poruszających się w klatce obrazu. Akcelerator jest w stanie wychwycić informacje na poziomie pikseli o takich elementach grafiki jak efekty cząsteczkowe, odbicia, cienie oraz oświetlenie, które nie są uwzględniane w obliczeniach wektora ruchu. Powinno to zapewnić wierniejsze odwzorowanie obrazu, pomimo że rozdzielczość wejściowa jest niższa od natywnej. Rdzenie Tensor przy wykorzystaniu instrukcji INT8, są w stanie zaoferować wydajność na poziomie 1,32 PTFLOPS, 5-krotnie więcej w porównaniu do Tensorów 3. generacji (Ampere). Technologię tę nazwano AI Frame Generator.

Test karty graficznej NVIDIA GeForce RTX 4090 - Kosmiczna wydajność w kosmicznej cenie. Mocna premiera! [nc1]

NVIDIA zaprezentowała też szereg ciekawostek programowych m.in. technikę RTX Remix, przeznaczoną do rewitalizacji wiekowych gier korzystających nawet z bibliotek DirectX 8/9. Cała inicjatywa ma umożliwić implementację ray tracingu w starszych tytułach, których API nie zostało do tego przystosowane, a jednocześnie poprawienie tekstur, oświetlenia i geometrii obiektów. Wszystko zautomatyzowane i osadzone w środowisku programistycznym RTX Remix Runtime, który dokonuje takiej rewitalizacji za pomocą sztucznej inteligencji. Istotna jest informacja, że odświeżone tytuły nie potrzebują aktualizacji, będą po prostu modyfikowane płynnie z wykorzystaniem dostępnych zasobów na platformie Omniverse.

Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Sebastian Oktaba
Liczba komentarzy: 442

Komentarze:

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.