NVIDIA A100 - najmocniejszy akcelerator Ampere doczeka się wersji ze złączem PCIe oraz 80 GB pamięci HBM2e
W maju 2020 roku, NVIDIA podczas specjalnego wydarzenia przygotowanego w ramach GPU Technology Conference, zaprezentowała po raz pierwszy możliwości nowej architektury Ampere. Zaczęła od największego i najwydajniejszego pojedynczego układu w postaci akceleratora A100, wykorzystywanego do wyspecjalizowanych obliczeń HPC oraz opartych na sztucznej inteligencji. Miesiąc później producent wprowadził układ A100 w wersji PCIe (wcześniej tylko w formie modułu SXM) - oba warianty początkowo oferowały 40 GB pamięci HBM2e, aczkolwiek po kilku miesiącach NVIDIA A100 SXM pojawiła się także z 80 GB pamięci. Wariant PCIe, choć mniej prądożerny, oferowany był wyłącznie z 40 GB VRAM. Wkrótce to się zmieni, bo z dokumentacji firmy wynika, że planowana jest kolejna wersja akceleratora dla PCIe, w jeszcze bardziej rozbudowanej wersji.
NVIDIA na dniach wprowadzi do oferty akcelerator graficzny A100, oparty na architekturze Ampere (GA100) i oferujący 80 GB pamięci na złączu PCIe.
NVIDIA A100 przetestowane - to najszybszy akcelerator na świecie
Układ NVIDIA A100 PCIe oparty jest na 7 nm procesie technologicznym TSMC. Sam rdzeń graficzny Ampere GA100 ma także dużo większą powierzchnię 826 mm², co sprawia że mamy do czynienia wręcz z gigantycznym układem. Ampere GA100 zawiera w sobie m.in. 54 miliardy tranzystorów, aczkolwiek zaprezentowany dotychczas wariant wyposażono w 6912 rdzeni CUDA oraz 108 aktywnych bloków SM (Streaming Multiprocessor). Nie jest to więc pełny rdzeń, który oferuje 128 bloków SM oraz 8192 rdzenie CUDA. Pierwsza wersja układu A100 z magistralą PCIe 4.0 posiadała 40 GB pamięci HBM2e o łącznej przepustowości 1555 GB/s.
Superkomputer Perlmutter zostanie wyposażony w 1536 procesorów AMD EPYC 7763 i ponad 6 tysięcy układów NVIDIA A100
Choć NVIDIA jeszcze nie zdradziła oficjalnie tej informacji, na stronie pojawiły się wzmianki na temat nowej wersji akceleratora A100, który nie tylko korzysta z magistrali PCIe 4.0, ale także posiada dwukrotnie więcej pamięci - 80 GB HBM2e, o jeszcze wyższej przepustowości, sięgającej 2 TB/s. Będzie to zatem jeden z najbardziej rozbudowanych akceleratorów do profesjonalnych zadań. Na chwilę obecną dokumentacja określa wyłącznie większy rozmiar pamięci VRAM. Nie wiemy czy sama konfiguracja rdzenia pozostanie taka sama, czy NVIDIA pokusi się w końcu o wprowadzenie być może pełnego układu Ampere GA100 z 8192 rdzeniami CUDA.
Powiązane publikacje

Złącze 12V-2x6 znów pod lupą. Tym razem uszkodzona została karta Sapphire Radeon RX 9070 XT NITRO+
122
MaxSun Intel Arc Pro B60 Dual 48G Turbo to dwa procesory graficzne Intel Arc B60 na jednym laminacie dla profesjonalistów
8
Karta graficzna GALAX RTX 5060 Ti 16GB w konstrukcji single-slot z zaawansowanym systemem chłodzenia komorą parową
24
Intel demonstruje działanie XeSS Multi Frame Generation na przykładzie gry Painkiller i na układzie Panther Lake z 12 Xe-Core
48