AMD Instinct MI250X - poznaliśmy specyfikację topowego akceleratora graficznego CDNA 2 z układem Aldebaran
Od kilku miesięcy, regularnie pojawiają się doniesienia na temat specyfikacji akceleratora graficznego AMD Instinct MI200. Układ graficzny, oparty na architekturze CDNA 2, ma być pierwszym GPU wykorzystującym budowę typu MCM, niczym obecne procesory AMD Ryzen. Producent już wcześniej potwierdzał wykorzystanie budowy MCM dla swojego flagowego akceleratora, który będzie posiadał dwa główne bloki obliczeniowe (dwa chiplety). Tymczasem w sieci pojawiły się konkretne informacje na temat specyfikacji nadchodzącego flagowca CDNA 2. Okazuje się, że akcelerator nie będzie nazwany Instinct MI200, a Instinct MI250X. Oprócz niego pojawi się także nieco słabszy wariant Instinct MI250.
W sieci pojawiła się częściowa specyfikacja akceleratora graficznego AMD Instinct M250X, będącego flagowym modelem opartym na architekturze CDNA 2. Otrzymamy układ MCM ze 128 GB pamięci HBM2e i z mocą obliczeniową FP32 na poziomie 47,9 TFLOPS.
AMD Instinct MI300 - Pierwsze infomarcje o następcy AMD Aldebaran. Akceleratory będą korzystać z aż czterech chipletów
Zarówno AMD Instinct MI250 jak również Instinct MI250X będą oparte na układzie Aldebaran. Wariant z dopiskiem X będzie wyposażony w dwa chiplety oraz łącznie 110 bloków Compute Units. Flagowy układ CDNA 2 zostanie wyposażony w 128 GB pamięci typu HBM2e, a taktowanie rdzenia będzie wynosić około 1700 MHz. Moc obliczeniowa w zadaniach opartych na pojedynczej precyzji (FP32) ma sięgać 47,9 TFLOPS. To ponad dwukrotnie więcej niż AMD Instinct MI100, którego wydajność FP32 wynosi 23,1 TFLOPS. Co ciekawe, Instinct MI250X tym sposobem zbliży się do akceleratora Intel Ponte Vecchio. W sierpniu bowiem ogłoszono, że akcelerator Xe-HPC osiąga wydajność FP32 na poziomie 45 TFLOPS.
Enough teasing. MI200 has two variants: MI250 and MI250X
— ExecutableFix (@ExecuFix) October 23, 2021
MI250X
110 CUs, 1.7GHz boost
128GB HBM2e
500W TDP, 7nm
383 FP16/BF16
— ExecutableFix (@ExecuFix) October 23, 2021
Intel Ponte Vecchio - charakterystyka architektury wydajnego akceleratora graficznego przeznaczonego dla rynku HPC
Według ujawnionych informacji, AMD Instinct MI250X ma osiągać bardzo wysoką wydajność w obliczeniach podwójnej precyzji (FP64). Tutaj moc wyrażana w TFLOPS także ma osiągać wartość 47,9. Dla porównania Instinct MI100 osiąga tutaj wydajność rzędu 11,5 TFLOPS, z kolei akcelerator NVIDIA A100 tylko 9,7 TFLOPS. W obliczeniach połowicznej precyzji (FP16), AMD Instinct MI250X ma z kolei oferować wydajność na poziomie 383 TFLOPS (185 TFLOPS dla AMD Instinct MI100 dla porównania). Współczynnik TDP akceleratora ma sięgać 500 W. Wygląda na to, że AMD przygotowuje akcelerator o naprawdę ogromnych możliwościach dla rynku HPC.