NVIDIA A100 - najmocniejszy akcelerator Ampere doczeka się wersji ze złączem PCIe oraz 80 GB pamięci HBM2e
W maju 2020 roku, NVIDIA podczas specjalnego wydarzenia przygotowanego w ramach GPU Technology Conference, zaprezentowała po raz pierwszy możliwości nowej architektury Ampere. Zaczęła od największego i najwydajniejszego pojedynczego układu w postaci akceleratora A100, wykorzystywanego do wyspecjalizowanych obliczeń HPC oraz opartych na sztucznej inteligencji. Miesiąc później producent wprowadził układ A100 w wersji PCIe (wcześniej tylko w formie modułu SXM) - oba warianty początkowo oferowały 40 GB pamięci HBM2e, aczkolwiek po kilku miesiącach NVIDIA A100 SXM pojawiła się także z 80 GB pamięci. Wariant PCIe, choć mniej prądożerny, oferowany był wyłącznie z 40 GB VRAM. Wkrótce to się zmieni, bo z dokumentacji firmy wynika, że planowana jest kolejna wersja akceleratora dla PCIe, w jeszcze bardziej rozbudowanej wersji.
NVIDIA na dniach wprowadzi do oferty akcelerator graficzny A100, oparty na architekturze Ampere (GA100) i oferujący 80 GB pamięci na złączu PCIe.
NVIDIA A100 przetestowane - to najszybszy akcelerator na świecie
Układ NVIDIA A100 PCIe oparty jest na 7 nm procesie technologicznym TSMC. Sam rdzeń graficzny Ampere GA100 ma także dużo większą powierzchnię 826 mm², co sprawia że mamy do czynienia wręcz z gigantycznym układem. Ampere GA100 zawiera w sobie m.in. 54 miliardy tranzystorów, aczkolwiek zaprezentowany dotychczas wariant wyposażono w 6912 rdzeni CUDA oraz 108 aktywnych bloków SM (Streaming Multiprocessor). Nie jest to więc pełny rdzeń, który oferuje 128 bloków SM oraz 8192 rdzenie CUDA. Pierwsza wersja układu A100 z magistralą PCIe 4.0 posiadała 40 GB pamięci HBM2e o łącznej przepustowości 1555 GB/s.
Superkomputer Perlmutter zostanie wyposażony w 1536 procesorów AMD EPYC 7763 i ponad 6 tysięcy układów NVIDIA A100
Choć NVIDIA jeszcze nie zdradziła oficjalnie tej informacji, na stronie pojawiły się wzmianki na temat nowej wersji akceleratora A100, który nie tylko korzysta z magistrali PCIe 4.0, ale także posiada dwukrotnie więcej pamięci - 80 GB HBM2e, o jeszcze wyższej przepustowości, sięgającej 2 TB/s. Będzie to zatem jeden z najbardziej rozbudowanych akceleratorów do profesjonalnych zadań. Na chwilę obecną dokumentacja określa wyłącznie większy rozmiar pamięci VRAM. Nie wiemy czy sama konfiguracja rdzenia pozostanie taka sama, czy NVIDIA pokusi się w końcu o wprowadzenie być może pełnego układu Ampere GA100 z 8192 rdzeniami CUDA.