NVIDIA A100 - akcelerator z rdzeniem Ampere GA100 w wersji PCI-E

Damian Marusiak | 22-06-2020 12:00 |

Karty graficzne

NVIDIA A100 - akcelerator z rdzeniem Ampere GA100 w wersji PCI-E Nieco ponad miesiąc temu NVIDIA podczas specjalnego wydarzenia przygotowanego w ramach GPU Technology Conference, zaprezentowała możliwości nowej architektury Ampere. Zaczęła od największego i najwydajniejszego pojedynczego układu w postaci Tesla A100. Wówczas poznaliśmy specyfikację układu GPU przygotowanego w formacie SXM o wysokim współczynniku poboru energii, sięgającego 400 W. Teraz producent kart przygotował taki sam akcelerator A100, jednak w wersji PCIe. Poznaliśmy nie tylko wygląd karty, ale także jej specyfikację. Co ciekawe, wariant PCIe charakteryzuje się dużo mniejszym współczynnikiem poboru energii - TDP w tym wypadku sięga maksymalnie 250 W. Pozostałe parametry NVIDIA A100 są jednak bliźniaczo podobnie. Teraz czekamy już tylko na prezentację profesjonalnych i konsumenckich kart Quadro oraz GeForce.

NVIDIA zaprezentowała akcelerator Ampere A100 w formacie PCIe. Dotychczas GPU było dostępne tylko w formacie SXM z dużo wyższym poborem energii sięgającym 400 W.

Układ NVIDIA Tesla A100 PCIe będzie oparty na 7 nm procesie technologicznym TSMC. Sam rdzeń graficzny Ampere GA100 będzie miał powierzchnię 826 mm², co sprawia że mamy do czynienia wręcz z gigantycznym układem. Ampere GA100 zawiera w sobie m.in. 54 miliardy tranzystorów, aczkolwiek zaprezentowany dotychczas wariant wyposażono w 6912 rdzeni CUDA oraz 108 aktywnych bloków SM (Streaming Multiprocessor). Nie jest to więc pełny rdzeń, który oferuje 128 bloków SM oraz 8192 rdzenie CUDA. Z pewnością jednak w pewnym momencie NVIDIA wypuści i najbardziej dopakowany wariant Ampere.

Specyfikacja	NVIDIA Tesla A100	NVIDIA Tesla V100	NVIDIA Tesla P100
Architektura	Ampere	Volta	Pascal
Litografia	7 nm N7 TSMC	12 nm	16 nm
Powierzchnia chipu	826 mm²	815 mm²	610 mm²
Ilość tranzystorów	54,2 mld	21,1 mld	15,3 mld
Rdzenie CUDA	6912	5120	3584
Jednostki TMU	432	320	224
Pamięć cache L2	40960 KB	6144 KB	4096 KB
Wydajność FP16	78 TFLOPS	31,4 TFLOPS	21,2 TFLOPS
Wydajność FP32	19,5 TFLOPS	15,7 TFLOPS	10,6 TFLOPS
Wydajność FP64	9,7 TFLOPS	7,8 TFLOPS	5,3 TFLOPS
Tensor Cores	432	640	N/A
Pamięć VRAM	40 GB HBM2e	16 / 32 GB HBM2	16 GB HBM2
Magistrala pamięci	5120-bit	4096-bit	4096-bit
Przepustowość pamięci	1555 GB/s	900 GB/s	720 GB/s
TDP	400 W (SXM) / 250 W (PCIE)	300 W	300 W

NVIDIA A100 PCIe została wyposażona w 40 GB pamięci HBM2e produkcji Samsunga. Przepustowość pamięci sięga w obu wersjach imponujące 1555 GB/s. Nie brakuje także nowych i dużo bardziej udoskonalonych rdzeni Tensor - tych w akceleratorze A100 jest dokładnie 432. W przeciwieństwie do wariantu SXM, akcelerator PCIe ma dużo mniejsze TDP wynoszące 250 W zamiast 400 W. NVIDIA zapewnia, że wydajność szczytowa obu wariantów GPU będzie identyczna, jednak przy ciągłym i długotrwałym obciążeniu, wersja A100 PCIe będzie osiągała od 10 do 50 procent niższe wyniki w wybranych zastosowaniach w porównaniu do wariantu SXM.

Akcelerator NVIDIA A100 PCIe służy między innymi do zaawansowanych obliczeń związanych ze sztuczną inteligencją (głębokie uczenie AI) oraz interferencją. Ponadto świetnie sprawdzi się w centrach danych oraz jako karta do obszernych obliczeń naukowych. Wraz z premierą wariantu PCIe układu, firma ASUS zaprezentowała swój najnowszy serwer oparty właśnie na akceleratorze A100 PCIe. Mowa o modelu ASUS ESC4000A-E10, napędzany między innymi na serwerowym procesorze AMD EPYC 7002. Nowy serwer wykorzysta także wszystkie zalety interfejsu PCIE 4.0 - nie zabraknie łącznie 11 slotów PCIE 4.0 do obsługi obliczeń, grafiki, pamięci masowej i rozszerzeń sieciowych. Dzięki elastycznej obudowie serwera ASUS ESC4000A-E10 może pomieścić do 8 dysków twardych 3,5" lub 2,5" z możliwością wymiany podczas pracy, a cztery z nich są opcjonalnie przeznaczone na dyski SSD NVMe.

Źródło: VideoCardz

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

TrashBench ustanawia rekord OC układu GeForce GTX 1060 osiągając 2202 MHz z nietypowym autorskim chłodzeniem

NVIDIA GeForce RTX 5090 bez pełnego PCIe 5.0 sporo traci w niektórych zastosowaniach. Jak bardzo może zwolnić?

Karta graficzna GALAX GeForce RTX 5090 D ustanowiła nowe rekordy overclockingu osiągając 3650 MHz GPU i 36 Gbps GDDR7

Karty graficzne GeForce RTX 5060 Ti oraz Radeon RX 9060 XT w wersjach 16 GB VRAM sprzedają się o wiele lepiej niż warianty 8 GB

117

ONE-NETBOOK OneXGPU Lite to nowa stacja eGPU z interfejsem Thunderbolt 5 i układem AMD Radeon RX 7600M XT

Liczba komentarzy: 27

Komentarze:

Załaduj komentarze

NVIDIA A100 - akcelerator z rdzeniem Ampere GA100 w wersji PCI-E

NVIDIA zaprezentowała akcelerator Ampere A100 w formacie PCIe. Dotychczas GPU było dostępne tylko w formacie SXM z dużo wyższym poborem energii sięgającym 400 W.

Powiązane publikacje

TrashBench ustanawia rekord OC układu GeForce GTX 1060 osiągając 2202 MHz z nietypowym autorskim chłodzeniem

NVIDIA GeForce RTX 5090 bez pełnego PCIe 5.0 sporo traci w niektórych zastosowaniach. Jak bardzo może zwolnić?

Karta graficzna GALAX GeForce RTX 5090 D ustanowiła nowe rekordy overclockingu osiągając 3650 MHz GPU i 36 Gbps GDDR7

Karty graficzne GeForce RTX 5060 Ti oraz Radeon RX 9060 XT w wersjach 16 GB VRAM sprzedają się o wiele lepiej niż warianty 8 GB

ONE-NETBOOK OneXGPU Lite to nowa stacja eGPU z interfejsem Thunderbolt 5 i układem AMD Radeon RX 7600M XT

Komentarze:

Test smartfona vivo V50 - stylowy model z pojemną baterią. Zachwyci amatorów fotografii, ale rozczaruje maniaków wydajności

Test obudowy komputerowej FSP M580 - Jednolita szklana tafla i cztery wentylatory z efektem lustra w rozsądnej cenie

Test karty graficznej KFA2 GeForce RTX 5080 1-Click OC - Efektowne podświetlenie ARGB i regulowana podpórka w komplecie

Recenzja Soundcore Boom 3i. Pływający głośnik Bluetooth z dobrym basem, oświetleniem RGB i niezłym akumulatorem

Test obudowy komputerowej Corsair Frame 4000D RS - Przewiewna modułowa konstrukcja z kilkoma fajnymi udogodnieniami

Najciekawsze informacje technologiczne - podsumowanie czerwiec 2025. Premiera AMD Radeon RX 9060 XT i pokaz Wiedźmina 4

Badacze ukrywają prompty AI w publikacjach naukowych, aby manipulować systemami recenzji peer-review

Czym jest Flatpak i jaki ma związek z Flathub? Krótkie omówienie Linuksowych rozwiązań i garść nowych statystyk

Jaki Linux do gier? Który układ graficzny? Nowe statystyki ze Steam ukazują, jak wygląda granie w świecie Open Source (częściowo)

TrashBench ustanawia rekord OC układu GeForce GTX 1060 osiągając 2202 MHz z nietypowym autorskim chłodzeniem

Test wydajności DOOM: The Dark Ages - Path Tracing to piekielne wymagania sprzętowe. Porównanie wydajności i jakości grafiki

NVIDIA z totalną dominacją na rynku kart graficznych dla PC. Intel na tym rynku praktycznie nie istnieje

AMD Radeon RX 9070 XT - modele z pamięciami GDDR6 od Samsunga są trochę wolniejsze od tych z modułami od SK hynix

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

Karty graficzne AMD Radeon RX 9000 w cenach blisko MSRP. Sytuacja architektury RDNA 4 wygląda już dużo lepiej

O portalu PurePC

Najważniejsze

Znajdź PurePC na