AMD Instinct MI100 - akcelerator CDNA dla HPC zaprezentowany
Od dłuższego czasu wiedzieliśmy, że AMD oprócz gamingowych kart graficznych opartych na architekturze RDNA, pracuje także nad profesjonalnymi układami dla HPC i superkomputerów. Owe układy miały wykorzystać zupełnie nową architekturę CDNA, o czym dowiedzieliśmy się wiosną tego roku. Na chwilę przed rynkowym debiutem pierwszych kart graficznych dla graczy, wykorzystujących architekturę RDNA 2, producent przedstawił szczegóły dotyczące flagowego układu dla sektora HPC. Mowa oczywiście o akceleratorze AMD Instinct MI100, o którym plotki pojawiały się już od przynajmniej kilku miesięcy. Producent zachwala swoje nowe dzieło jako najwydajniejszy układ dla sektora HPC, który jako jedyny przekracza barierę ponad 10 TFLOPS w obliczeniach FP64.
AMD oficjalnie zaprezentowało akcelerator HPC Instinct MI100, będący konkurencją dla NVIDIA A100 opartego na architekturze Ampere (GA100).
Trzeba przyznać, że specyfikacja nowego układu AMD robi niemałe wrażenie. Akcelerator Instinct MI100 wykorzystuje zupełnie nową architekturę CDNA o znacznie gęstszym upakowaniu jednostek obliczeniowych, cechujących się ponadto zmodyfikowaną budową w porównaniu do poprzedniej architektury. CDNA posiada również kilka ciekawych nowości. Matrix Core jest w stanie dwukrotnie zwiększyć moc obliczeniową akceleratora w obliczeniach FP32. Tym samym AMD rzuca rękaw firmie NVIDIA również na rynku profesjonalnych układów przeznaczonych do centrów danych oraz obliczeń związanych ze sztuczną inteligencją. AMD nawet nie ukrywa tego i chwali się, że ich układ będzie wydajniejszy od akceleratora NVIDIA A100, w dodatku przy niższym zużyciu energii. A100 ma deklarowane TDP na poziomie 400 W, z kolei Instinct MI100 ma współczynnik TBP (Total Board Power) wynoszący 300 W. Całość oczywiście opracowano w 7 nm procesie technologicznym TSMC.
AMD Instinct MI100 wyposażono w rdzeń graficzny oparty na architekturze CDNA i wyposażony w łącznie 120 jednostek Compute Units, co przekłada się sumarycznie na 7680 procesorów strumieniowych. Maksymalne taktowanie rdzenia będzie sięgać 1502 MHz. W takim wypadku moc obliczeniowa akceleratora wyniesie odpowiednio 184,6 TFLOPS dla FP16 (obliczenia połowicznej precyzji), 23,1 TFLOPS w obliczeniach pojedynczej precyzji FP32, 46,1 TFLOPS w FP32 przy dodatkowym wsparciu technologii Matrix oraz 11,5 TFLOPS dla obliczeń podwójnej precyzji FP64. Pod tym względem układ AMD Instinct MI100 faktycznie wypada lepiej od NVIDII A100. Ze specyfikacji warto również nadmienić, iż akcelerator CDNA wyposażono w 32 GB pamięci HBM2 na magistrali 4096-bitowej. Przekłada się to na przepustowość sięgającą nawet 1228,8 GB/s. Platforma wspiera oczywiście interfejs PCIe 4.0.
Specyfikacja | AMD Instinct MI100 | NVIDIA A100 80 GB | NVIDIA A100 40 GB |
Architektura | CDNA 1.0 | Ampere | Ampere |
Proces technologiczny | 7 nm TSMC | 7 nm TSMC | 7 nm TSMC |
Procesory strumieniowe | 7680 | 6912 | 6912 |
Taktowanie rdzenia | 1502 MHz | 1410 MHz | 1410 MHz |
Taktowanie pamięci | 3,2 Gbps HBM2e | 2,4 Gbps HBM2 | |
Pamięć VRAM | 32 GB HBM2 | 80 GB HBM2e | 40 GB HBM2 |
Magistrala pamięci | 4096-bit | 5120-bit | 5120-bit |
Przepustowość | 1,23 TB/s | 2,0 TB/s | 1,6 TB/s |
Wydajność FP16 | 184,6 TFLOPS (Matrix) | 312 TFLOPS (Tensor) | 312 TFLOPS (Tensor) |
Wydajność FP32 | 23,1 TFLOPS 46,1 TFLOPS (Matrix) |
19,5 TFLOPS | 19,5 TFLOPS |
Wydajność FP64 | 11,5 TFLOPS | 9,7 TFLOPS | 9,7 TFLOPS |
TDP | 300 W | 400 W | 400 W |
Co ciekawe, w tym samym czasie NVIDIA zapowiedziała jeszcze bardziej dopakowaną wersję akceleratora A100, wyposażoną w 80 GB pamięci HBM2e o łącznej przepustowości blisko 2 TB/s. Dodatkowo zaprezentowano serwer NVIDIA DGX Station A100 z maksymalnie czterema akceleratorami A100. Tym samym jeden taki serwer może otrzymać do 320 GB szybkiej pamięci HBM2e. Cena nowych układów AMD i NVIDII pozostaje jednak obecnie nieznana, przy czym wiemy już że akceleratory NVIDII będą szerzej dostępne w styczniu.
Powiązane publikacje

AMD Radeon RX 7650 GRE - nowa karta graficzna RDNA 3. Ma 8 GB pamięci VRAM i znajomą specyfikację
20
NVIDIA GeForce RTX 4060 - zbliża się koniec produkcji najniżej pozycjonowanego układu graficznego z rodziny Ada Lovelace
19
ASUS oferuje rekompensaty osobom z kartami uszkodzonymi przez mechanizm Q-Release Slim. Niestety tylko w Chinach
16
ASUS ROG Astral GeForce RTX 5090 Dhahab OC Edition - nowy wariant topowej karty graficznej o niecodziennej stylistyce
112