NVIDIA H100 będzie jeszcze mocniejszy - producent aktualizuje specyfikację akceleratora graficznego Hopper
Akcelerator graficzny NVIDIA H100, oparty na układzie GH100 i architekturze Hopper, został zaprezentowany ponad pół roku temu, jednak dopiero dwa tygodnie temu poinformowano o jego dostępności dla klientów. Choć specyfikacja układu z grubsza została ujawniona podczas marcowego GTC, NVIDIA przez ostatnie miesiące jeszcze bardziej dopracowywała akcelerator. Producent zaktualizował specyfikację H100 na swojej stronie i wygląda na to, że będzie on jeszcze mocniejszy niż sądzono.
NVIDIA zaktualizowała specyfikację akceleratora graficznego H100 - oferuje on jeszcze wyższą moc obliczeniową FP32 i FP64 niż ujawniono przy okazji marcowej konferencji GTC.
NVIDIA H100 - akcelerator graficzny oparty na architekturze Hopper może wkrótce dostać wersję ze 120 GB pamięci
Podczas marcowej konferencji GTC 2022, NVIDIA ujawniła akcelerator graficzny H100 w wersji w obudowie SXM5 oraz PCIe. Moc obliczeniowa FP32 dla obu wariantów układu GPU wynosiła odpowiednio 60 TFLOPS oraz 48 TFLOPS. Zaktualizowana specyfikacja zawiera informację, iż moc dla obliczeń pojedynczej precyzji wynosi obecnie 67 TFLOPS dla H100 SXM5 oraz 51 TFLOPS dla PCIe. Zwiększyły się również możliwości akceleratora w dziedzinie obliczeń podwójnej precyzji (tzw. FP64). Pierwotnie wyniki wynosiły 30 TFLOPS dla H100 SXM5 oraz 24 TFLOPS dla PCIe - teraz jest to już 34 TFLOPS oraz 26 TFLOPS.
NVIDIA H100 SXM5 | NVIDIA H100 PCIe 80 GB | |
Architektura | Hopper | Hopper |
Układ graficzny | GH100 | GH100 |
Litografia | TSMC "4N" | TSMC "4N" |
Powierzchnia | 814 mm² | 814 mm² |
Liczba tranzystorów | 80 mld | 80 mld |
Jednostki SP | 16896 CUDA | 14592 CUDA |
Jednostki TMU | 528 | 456 |
Jednostki Tensor | 528 Tensor 4. generacji | 456 Tensor 4. generacji |
Moc FP32 | 67 TFLOPS (wcześniej 60) | 51 TFLOPS (wcześniej 48) |
Moc FP64 | 34 TFLOPS (wcześniej 30) | 26 TFLOPS (wcześniej 24) |
Cache L2 | 50 MB | 50 MB |
Ilość pamięci | 80 GB HBM3 | 80 GB HBM2e |
Szyna pamięci | 5120-bit | 5120-bit |
Przepustowość VRAM | 3 TB/s | 2 TB/s |
Interfejs | SXM5 | PCIe |
Współczynnik TDP | 700 W | 350 W |
Premiera akceleratora NVIDIA H100 Hopper - Litografia TSMC 4 nm, 80 GB pamięci HBM3 i TDP do 700 W
Za zwiększeniem wydajności w różnych typach obliczeń odpowiadają wyższe zegary rdzenia układu graficznego. W przypadku pierwotnej specyfikacji mowa o przynajmniej 1770 MHz, by móc uzyskać moc obliczeniową dla FP32 i FP64 na podanym wyżej poziomie. Wzrost w finalnej specyfikacji sugeruje podwyższenie częstotliwości zegara rdzenia do przynajmniej 1982 MHz. Najwyraźniej przez ostatnie pół roku udało się jeszcze poprawić możliwości niestandardowej litografii TSMC 4N, która przygotowana została specjalnie dla NVIDII - to w tym procesie (będącym de facto 5 nm z usprawnieniami) tworzone są zarówno układy GH100 Hopper dla rynku HPC/AI jak również Ada Lovelace AD102/103/104 dla kart GeForce RTX 4000.
Powiązane publikacje

ASUS ROG Astral GeForce RTX 5080 DOOM Edition to limitowana karta graficzna dla fanów gry DOOM: The Dark Ages
36
NVIDIA GeForce RTX 5070 Ti - Podkręcono pamięć karty graficznej. Kości GDDR7 od SK hynix osiągnęły 34 Gb/s
187
ASUS GeForce RTX 5000 ROG Astral - karty graficzne Blackwell, które posiadają akcelerometr i żyroskop
90
AMD Radeon RX 9070 GRE został oficjalnie zaprezentowany w Chinach - Potwierdzono specyfikację i cenę karty RDNA 4
56