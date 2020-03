W ubiegłym tygodniu pisaliśmy o dwóch tajemniczych kartach graficznych NVIDII, które pojawiły się w sieci i zostały przetestowane w popularnym benchmarku GeekBench. Pierwszy układ wyposażony w 108 bloków SM, co przekłada się na 6912 rdzeni CUDA (o ile w nowej architekturze na każdy blok SM nadal będzie przyporządkowane 64 procesory strumieniowe) oraz 48 GB pamięci VRAM. Drugi układ był z kolei wyposażony w 118 bloków SM, co z kolei przekłada się na 7552 rdzenie CUDA. Karta ta również została wyposażona w 24 GB pamięci. Trzeci wariant był zdecydowanie najmocniejszy - wyposażony w 124 aktywne bloki SM, 7936 rdzeni CUDA oraz 32 GB pamięci HBM2e. W sieci pojawiło się kilka nowych informacji dotyczących rdzeni Ampere GA100 oraz GA102.

Według najnowszych (acz niepotwierdzonych) informacji, pełny rdzeń GA100 o rozmiarze 826 mm² może zaoferować maksymalnie 128 bloków SM oraz 8192 rdzenie CUDA - układ o takiej specyfikacji mógłby się znaleźć w nowej Tesli. Choć wczesne testy w bazie GeekBench prezentowały bardzo niskie taktowanie rdzenie, nowe doniesienia sugerują, że finalne wersje GPU będą oferowały taktowanie w trybie Boost na poziomie nawet 2200 MHz - przy takiej wartości, moc obliczeniowa w zadaniach pojedynczej precyzji wyniosłaby nawet 36 TFLOPS. Byłby to ogromny skok wydajności - dla porównania Quadro GV100 z taktowaniem na poziomie 1627 MHz oferuje moc przy FP32 na poziomie 16,6 TFLOPS. Układy bazujące na rdzeniu Ampere GA100 miałyby również mieć współczynnik TDP na poziomie przynajmniej 300W. W przypadku pamięci VRAM mielibyśmy do dyspozycji warianty z 24 lub 48 GB HBM2e. Mówi się także o podwojeniu ilości rdzeni Tensor, co z pewnością również znacząco zwiększyłoby wydajność w zadaniach, które wykorzystują owe rdzenie.

Kolejnym rdzeniem graficznym będzie Ampere GA102, który będzie napędzał m.in. następcę konsumenckiej karty NVIDIA GeForce RTX 2080 Ti. Według doniesień, chip GA102 ma oferować m.in. 5376 rdzeni CUDA oraz 12 GB pamięci VRAM. Układ ten ma również posiadać siedem klastrów dla przetwarzania grafiki (GPC) - zwiększenie ilości jednostek plus dodatkowe optymalizacje mają przełożyć się na 40% wyższą wydajność w porównaniu do układu NVIDIA GeForce RTX 2080 Ti. Być może więcej informacji dowiemy się 23 marca, gdy NVIDIA opublikuje zapowiedzi, które pierwotnie miały się pojawić podczas konferencji GPU Technology Conference w San Jose.

