Najwydajniejszym układem graficznym dla graczy wciąż pozostaje NVIDIA GeForce RTX 4090. Niestety obecnie nie możemy liczyć na konkurencję od AMD w tym segmencie, choć firma odnosi sukcesy na innym polu — w dziedzinie sztucznej inteligencji. W internecie pojawił się wynik testu flagowego akceleratora graficznego AMD Instinct MI300X. Okazał się on lepszy od wspomnianego układu NVIDII, jednak nie zajął pierwszego miejsca na liście wyników benchmarku Geekbench.

Akcelerator graficzny AMD Instinct MI300X, który jest przeznaczony do zadań związanych z AI, doczekał się debiutu w benchmarku Geekbench. Jednostka od razu znalazła się na szczycie listy, ale nie wyprzedziła wszystkich układów, jakimi dysponuje konkurencyjna NVIDIA.

AMD Instinct MI300X miał swoją premierę pod koniec 2023 roku, więc na wynik pierwszego testu z benchmarku Geekbench trzeba było trochę poczekać. Ten akcelerator graficzny opiera się na architekturze CDNA 3 i został wyposażony w 192 GB pamięci HBM3. Jego bezpośrednim rywalem jest układ NVIDIA H100, którego przeznaczeniem również są centra danych. W związku z tym dla zwykłych użytkowników jednostki te są nie tylko nieprzydatne, ale poniekąd również niedostępne — AMD Instinct MI300X to koszt od 15-20 tys. dolarów, natomiast wspomniana NVIDIA H100 (PCIe) to już wydatek rzędu 30-40 tys. dolarów.

NVIDIA H100 PCIe AMD Instinct MI250 AMD Instinct MI250X AMD Instinct MI300X Architektura Hopper CDNA 2 CDNA 2 CDNA 3 Budowa Monolit MCM MCM MCM Litografia TSMC 4 nm TSMC 6 nm TSMC 6 nm TSMC 5 nm

TSMC 6 nm FinFET Tranzystory 80 mld 58,2 mld 58,2 mld 153 mld Bloki CU/SM 114 208 220 304 Procesory 14592 13312 14080 19456 Rdzenie Matrix - 832 880 ? Rdzenie Tensor 456 (4 per SM) - - - Taktowanie Boost Brak informacji 1700 MHz 1700 MHz 2100 MHz Moc FP32 48,0 TFLOPS 45,3 TFLOPS 47,9 TFLOPS 163,4 TFLOPS Moc FP32 Matrix - 90,5 TFLOPS 95,7 TFLOPS 163,4 TFLOPS Moc FP64 24,0 TFLOPS 45,3 TFLOPS 47,9 TFLOPS 81,7 TFLOPS Moc FP64 Matrix - 90,5 TFLOPS 95,7 TFLOPS 163,4 TFLOPS Pamięć 80 GB HBM3 128 GB HBM2e 128 GB HBM2e 192 GB HBM3 Magistrala 5120-bit 8192-bit 8192-bit 8192-bit Przepustowość 2 TB/s 3,2 TB/s 3,2 TB/s 5,2 TB/s Pobór mocy 350 W 560 W 560 W 750 W

Przechodząc już do samych wyników z benchmarku Geekbench 6.3.0, w którym mierzona była wydajność układu graficznego z wykorzystaniem bibliotek OpenCL: tytułowy akcelerator graficzny osiągnął w tym teście wartość 379 660 pkt, czym udało mu się prześcignąć układ NVIDIA GeForce RTX 4090 o 6 340 pkt (warto zauważyć, że pobór mocy znacząco się różni pomiędzy tymi jednostkami). Wyżej zaskakująco uplasował się układ graficzny przeznaczony do stacji roboczych, a mianowicie NVIDIA RTX 6000 Ada, gdyż zakończył test z wynikiem 387 053 pkt. W czwartym kwartale 2024 roku na rynku pojawi się kolejny układ od AMD z rodziny Instinct (MI325X), który także zostanie oparty na architekturze CDNA 3, jednak zaoferuje aż 288 GB pamięci HBM3e - w tym wypadku celem jest konkurowanie z układem NVIDIA H200. Kolejne granice w benchmarku Geekbench szybko zostaną więc przekroczone, choć oczywiście nie do tego zostały stworzone omawiane jednostki.

Geekbench 6.3.0 (OpenCL Score) NVIDIA RTX 6000 Ada 387 053 pkt AMD Instinct MI300X 379 660 pkt NVIDIA GeForce RTX 4090 373 320 pkt NVIDIA L40S 368 917 pkt NVIDIA H100 337 925 pkt NVIDIA GeForce RTX 4080 288 340 pkt NVIDIA GeForce RTX 4070 SUPER 243 937 pkt AMD Radeon RX 7900 XTX 229 131 pkt

NVIDIA GeForce RTX 6000 ADA NVIDIA GeForce RTX 4090 Architektura Ada Lovelace Ada Lovelace Układ graficzny AD102 AD102 CUDA 18 176 16 384 Wydajność RT 210,6 TFLOPS 191 TFLOPS Wydajność Tensor 1457 TFLOPS 1321 TFLOPS Jednostki RT 142 128 Jednostki Tensor 568 512 Ilość pamięci 48 GB 24 GB Typ pamięci GDDR6 GDDR6X Szyna pamięci 384-bit 384-bit Przepustowość 960 GB/s 1000 GB/s Interfejs PCI-E 4.0 x16 PCI-E 4.0 x16 Współczynnik TGP 300 W 450 W

Źródło: Geekbench