Testy wydajności kart graficznych to niemalże codzienność na PurePC, jednak dotychczas przeważały procedury zbudowane na wymagających grach komputerowych. Cyberpunki, Wiedźminy i Assassiny najlepiej obrazują różnice między układami, tutaj chyba będziemy zgodni, niemniej GPU można z powodzeniem wykorzystać również w innych zadaniach. Chociażby podczas renderingu oraz zaawansowanej obróbki materiałów filmowych. Postanowiłem więc sprawdzić jakie korzyści przynosi akceleracja sprzętowa w kilku popularnych programach, które pozwalają na wykorzystanie potencjału układów graficznych m.in. Autodesk Maya, Blender, DaVinci Resolve czy OctaneRender.

Autor: Sebastian Oktaba

Wykorzystywanie akceleracji GPU zyskało w ostatnich latach ogromną popularność, zwłaszcza w wyspecjalizowanym oprogramowaniu, gdzie szybkość wykonywania operacji ma kluczowe znaczenie. Rzecz polega na przerzuceniu części obliczeń na kartę graficzną, odciążając tym samym główny procesor, którego efektywność w danych zastosowaniach jest przeważnie kilkukrotnie niższa. Wynika to chociażby z prostego faktu, że procesory desktopowe posiadają maksymalnie 16 rdzeni, natomiast dopiero serwerowe behemoty oferują 64-128 rdzeni. Summa summarum nawet w połączeniu z technikami HT/SMT, powyższe wartości nie robią specjalnego wrażenia, ponieważ NVIDIA GeForce RTX 3090 Ti posiada 10752 procesorów CUDA. Jeżeli obliczenia można wykonać równolegle, to nawet jeżeli jeden do jednego takie jednostki przegrywają z rdzeniem procesora pod względem wydajności, nadrabiają to liczebnością

Akceleracja GPU to prosty sposób na zwiększenie wydajności w wielu programach. Ile można zyskać względem najszybszych procesorów?

Główną siłę napędową procesorów stanowią rdzenie (x86), natomiast karty graficzne mają znacznie więcej różnych jednostek, gdzie kluczowe okazują się procesory strumieniowe (CUDA / SP). Pomijam oczywiście wpływ architektur czy budowy poszczególnych urządzeń. Finalnie najważniejsza będzie przecież wydajność, a obydwie kategorie produktów mogą wykonywać identyczne zadania jeżeli oprogramowanie pozwoli. Drugim czynnikiem przemawiającym na korzyść układów graficznych, przynajmniej w renderingu oraz obróbce materiałów foto-video, jest bezpośredni dostęp do pamięci VRAM mającej często ogromne znaczenie. W niektórych przypadkach jeśli projekt będzie potrzebował więcej zasobów niż dysponujemy, operacja może nie zostać wykonana. Dlatego NVIDIA zafundowała topowym modelom 24 GB GDDR6X, bowiem wbrew powszechnej opinii, to urządzenia kierowane bardziej do pracy aniżeli giercowania.

Ryzen 9 5950X GeForce RTX 3090 Ti Radeon RX 6900 XT Architektura Vermeer Ampere RDNA 2.0 Litografia 7 nm 8 nm 7 nm Rozmiar rdzenia 125 mm² 628 mm² 519 mm² Ilość rdzeni / wątków 16/32 (x86) 10752 (CUDA) 5120 (SP) Jednostki renderujące - 112 128 Jednostki teksturujące - 336 320 Jednostki RT - 82 80 Jednostki Tensor - 336 - Taktowanie bazowe 3400 MHz 1560 MHz 1825 MHz Taktowanie Turbo 4900 MHz 1860 MHz 2250 MHz Pamięć RAM / VRAM 32 GB DDR4 Dual 24 GB GDDR6X 384-bit 16 GB GDDR6 256-bit Taktowanie pamięci 3600 MHz CL14 21000 MHz 16000 MHz Współczynnik TDP / TGP 105 W 450 W 300 W Cena startowa 799 USD 1999 USD 999 USD

W przypadku układów graficznych bardzo istotne okazują się również wykorzystane interfejsy, mające ogromne znaczenie na kształtowanie wyników. Najbardziej uniwersalnym jest otwarty standard OpenCL, którego głównym orędownikiem zostało AMD, jednak gdzieniegdzie firma implementuje także własne rozwiązanie nazwane HIP (Blender to nawet wymusił). NVIDIA poszła tutaj jeszcze dalej dostarczając dwa rozwiązania oraz specjalne sterowniki Studio, jakie zostały zainstalowane w najnowszej dostępnej wersji. Po pierwsze, część programów umożliwia wybranie NVIDIA CUDA jako głównego interfejsu programowania kart graficznych, poprawiającego wydajność układów GeForce. Po drugie, niektóre rendery obsługują również silnik NVIDIA OptiX zwiększający efektywność w scenach wykorzystujących śledzenie promieni. We wszystkich przypadkach wybierałem najszybsze rozwiązanie dostępne dla platformy.