Akcelerator graficzny NVIDIA H100, oparty na układzie GH100 i architekturze Hopper, został zaprezentowany ponad pół roku temu, jednak dopiero dwa tygodnie temu poinformowano o jego dostępności dla klientów. Choć specyfikacja układu z grubsza została ujawniona podczas marcowego GTC, NVIDIA przez ostatnie miesiące jeszcze bardziej dopracowywała akcelerator. Producent zaktualizował specyfikację H100 na swojej stronie i wygląda na to, że będzie on jeszcze mocniejszy niż sądzono.

NVIDIA zaktualizowała specyfikację akceleratora graficznego H100 - oferuje on jeszcze wyższą moc obliczeniową FP32 i FP64 niż ujawniono przy okazji marcowej konferencji GTC.

Podczas marcowej konferencji GTC 2022, NVIDIA ujawniła akcelerator graficzny H100 w wersji w obudowie SXM5 oraz PCIe. Moc obliczeniowa FP32 dla obu wariantów układu GPU wynosiła odpowiednio 60 TFLOPS oraz 48 TFLOPS. Zaktualizowana specyfikacja zawiera informację, iż moc dla obliczeń pojedynczej precyzji wynosi obecnie 67 TFLOPS dla H100 SXM5 oraz 51 TFLOPS dla PCIe. Zwiększyły się również możliwości akceleratora w dziedzinie obliczeń podwójnej precyzji (tzw. FP64). Pierwotnie wyniki wynosiły 30 TFLOPS dla H100 SXM5 oraz 24 TFLOPS dla PCIe - teraz jest to już 34 TFLOPS oraz 26 TFLOPS.

NVIDIA H100 SXM5 NVIDIA H100 PCIe 80 GB Architektura Hopper Hopper Układ graficzny GH100 GH100 Litografia TSMC "4N" TSMC "4N" Powierzchnia 814 mm² 814 mm² Liczba tranzystorów 80 mld 80 mld Jednostki SP 16896 CUDA 14592 CUDA Jednostki TMU 528 456 Jednostki Tensor 528 Tensor 4. generacji 456 Tensor 4. generacji Moc FP32 67 TFLOPS (wcześniej 60) 51 TFLOPS (wcześniej 48) Moc FP64 34 TFLOPS (wcześniej 30) 26 TFLOPS (wcześniej 24) Cache L2 50 MB 50 MB Ilość pamięci 80 GB HBM3 80 GB HBM2e Szyna pamięci 5120-bit 5120-bit Przepustowość VRAM 3 TB/s 2 TB/s Interfejs SXM5 PCIe Współczynnik TDP 700 W 350 W

Za zwiększeniem wydajności w różnych typach obliczeń odpowiadają wyższe zegary rdzenia układu graficznego. W przypadku pierwotnej specyfikacji mowa o przynajmniej 1770 MHz, by móc uzyskać moc obliczeniową dla FP32 i FP64 na podanym wyżej poziomie. Wzrost w finalnej specyfikacji sugeruje podwyższenie częstotliwości zegara rdzenia do przynajmniej 1982 MHz. Najwyraźniej przez ostatnie pół roku udało się jeszcze poprawić możliwości niestandardowej litografii TSMC 4N, która przygotowana została specjalnie dla NVIDII - to w tym procesie (będącym de facto 5 nm z usprawnieniami) tworzone są zarówno układy GH100 Hopper dla rynku HPC/AI jak również Ada Lovelace AD102/103/104 dla kart GeForce RTX 4000.

Źródło: VideoCardz