Tesla V100 - Wydajność NVIDIA Volta w Geekbench 4 robi wrażenie
Konsumenckie karty graficzne na architekturze NVIDIA Volta, to jeszcze pieśń przyszłości, ale urządzenia dedykowane ambitniejszym zadaniom powoli trafiają do zamawiających (głównie instytucji naukowych). Dzięki temu światło dzienne ujrzały testy wydajności Volty, które wyglądają bardzo obiecująco. Nie... nie będzie to Crysis, ani Wiedźmin 3... I chociaż Geekbench 4 trudno uznać za wyznacznik tego, co przyniesie Volta w wydaniu cywilnym, jakieś porównanie do Pascala nareszcie się pojawiło. Rzecz dotyczy modelu NVIDIA DGX-1, klastra obliczeniowego stworzonego z myślą o uczeniu maszynowym (Deep Learning), który zasila skromne osiem Tesli V100. Co potrafi takie połączenie? Otóż potrafi naprawdę sporo...
Wyniki uchwycone w Geekbench 4 dotyczą superkomputera NVIDIA DGX-1, którego moc obliczeniowa sięga 960 TFLOPS (FP16), podczas gdy odpowiednik na Pascalach oferował zaledwie 170 TFLOPSów
Zacznijmy od przypomnienia specyfikacji - NVIDIA Tesla V100 (GV100) posiada 5120 procesorów CUDA, 320 jednostek teksturujących oraz 128 renderujących, a wszystko upchnięto w 80 klastrach SM. Chip jest ogromny, bowiem mierzy 815 mm² zawierając ponad 21 miliardów tranzystorów, jednak 12 nm proces technologiczny pozwolił okiełznać tego potwora -współczynnik TDP wynosi zaledwie 250W. Zegar bazowy rdzenia pracuje z częstotliwością 1370 MHz (GPU Boost tutaj nie występuje), natomiast 16 GB pamięci HBM2 na 4096-bitowej magistrali działa przy 1758 MHz, zapewniając przepustowość ponad 900 GB/s. Nawet bez wspominania o technologii NVLink 2.0 czy wyspecjalizowanych rdzeniach Tensor (640 na poszczególne GPU), liczby robią ogromne wrażenie. Jest to jednak sprzęt do rozwijania AI (Deep Learning), więc część z tych bajerów do konsumenckich odmian Volty nie trafi. Sam rdzeń prawie na pewno zostanie też przycięty, ewentualnie zasili kolejną wersję Titan X, jeśli NVIDIA będzie miała taki kaprys lub potrzebę. Bardziej prawdopodobnie jest jednak, że desktopowe GV100 przejdzie mocną terapie odchudzającą, zaś miejsce pamięci HBM2 zastąpią tańsze moduły GDDR6.
NVIDIA Tesla V100 - architektura Volta odkrywa pierwsze karty!
OK, same wyniki uchwycone w Geekbench 4 dotyczą superkomputera NVIDIA DGX-1, którego moc obliczeniowa sięga 960 TFLOPS przy uwzględnieniu Tensor Core, podczas gdy odpowiednik na Pascalach oferował zaledwie 170 TFLOPSów (porównanie dla FP16). Całością zarządza dwudziestordzeniowy i czterdziestowątkowy procesor Intel Xeon E5-2698 V4, taktowany zegarem 2,2 GHz, któremu towarzyszy 512 GB pamięci DDR4 oraz prawie 2 TB przestrzeni dyskowej (SSD spięte w RAID 0). Zasilaniem zajmuje się jednostka o mocy 3,2 KW. A teraz najlepsze - wydajność pojedynczego rdzenia Volta vs Pascal pokazuje, że nowość może nieźle namieszać na rynku superkomputerów. W teście CUDA, karta na architekturze NVIDIA Volta uzyskała 743.537 punktów, natomiast model z generacji Pascal tylko 320.031 punktów. W teście OpenCL sprzęt uzyskuje 481.504 punktów, zaś platforma HP Z8 G4, mająca na pokładzie karty NVIDIA Quadro GP100, jedynie 278.706 punktów. Porównanie może nie jest specjalnie precyzyjne choćby ze względu na różnice w systemach operacyjnych (Windows vs Linux), ciężko także oszacować, ile zawdzięczamy dedykowanym rdzeniom Tensor, niemniej w przypadku superkomputerów chyba mamy rewolucję.
Powiązane publikacje

ASUS ROG Astral GeForce RTX 5080 DOOM Edition to limitowana karta graficzna dla fanów gry DOOM: The Dark Ages
36
NVIDIA GeForce RTX 5070 Ti - Podkręcono pamięć karty graficznej. Kości GDDR7 od SK hynix osiągnęły 34 Gb/s
187
ASUS GeForce RTX 5000 ROG Astral - karty graficzne Blackwell, które posiadają akcelerometr i żyroskop
90
AMD Radeon RX 9070 GRE został oficjalnie zaprezentowany w Chinach - Potwierdzono specyfikację i cenę karty RDNA 4
56