NVIDIA GP100 Pascal Tesla - Oficjalna specyfikacja techniczna
Nareszcie otrzymaliśmy konkretne informacje o architekturze Pascal, której rynkowa premiera powinna nastąpić w przeciągu kilku miesięcy. Podczas trwającej konferencji GTC 2016, NVIDIA ujawniła specyfikację techniczną GP100 dla Tesli, będącego najpotężniejszym układem graficznym w ofercie producenta. Rozwiązanie jest wprawdzie dedykowane obliczeniom wysokiej wydajności, czyli rynkowi serwerów, stacji roboczych oraz centrów przetwarzania danych, aczkolwiek istnieje duże prawdopodobieństwo, że topowe rozwiązania dla graczy będą posiadały bardzo zbliżone parametry. Analogiczna sytuacja zachodziła między NVIDIA Tesla M40 oraz GeForce GTX Titan X, dlatego można śmiało zgadywać, że układ GP100 będzie również wykorzystany w topowym modelu GeForce GTX.
NVIDIA GP100 Pascal Tesla to 16 nm FinFET, 16 GB pamięci HBM2 oraz licznie rozwiązania, mające przyspieszyć obliczenia w serwerach.
Zaprezentowana odmiana GP100 jest oczywiście ukierunkowana na obliczenia podwójnej precyzji (FP64), gdzie osiąga imponujące 5.3 TFLOP, podczas gdy najszybsze Tesle bazujące na rdzeniu GM200 wyciągały zaledwie 0.20 TFLOP. Wydajność w obliczeniach pojedynczej precyzji (FP32) sięga natomiast 10.6 TFLOPs, zostawiając daleko w tumanach kurzu Maxwella z wynikiem 6.10 TFLOP (Tesla M40). Układ GP100 jest bardzo skomplikowany, posiada bowiem 15,3 miliarda tranzystorów, czyli prawie dwukrotnie więcej od GM200 napędzającego poprzednią generację Tesli, GeForce GTX 980 Ti oraz GeForce GTX Titan X. Maksymalny rozmiar chipu nie uległ jednak znacznemu powiększeniu względem Maxwella (610 vs 601 mm2), dzięki przejściu na 16 nm proces technologiczny FinFET od fabryk TSMC.
Rdzeń GP100 zawiera też niespotykane wcześniej funkcje m.in.: NVLink będące energooszczędnym połączeniem o wysokiej przepustowości, które umożliwia ultraszybką komunikację pomiędzy jednostkami CPU i GPU, a także samymi GPU. Technologia umożliwia wymianę danych od 5 do 12 razy szybszą niż w przypadku tradycyjnego złącza PCI-E 3.0 x16, co jest szczególnie przydatne w akceleracji obliczeń równoległych i dostępne na wybranych platformach sprzętowych. GP100 Pascal otrzyma 3840 procesorów CUDA (56 CU), nieznacznie więcej od GM200 Maxwell, aczkolwiek jednostki wykonawcze zostaną inaczej skonstruowane tzn.: poprawiono ich sprawność, ilość obsługiwanych wątków itp. Wartość jednostek teksturujących i renderujących pozostaje póki co nieznana.
Potwierdzono natomiast obecność 16 GB pamięci HBM2 4096-bit o maksymalnej przepustowości wynoszącej 1 TB/s. Kości do akceleratora NVIDII dostarczy Samsung, niemniej sam rdzeń GP100 zostanie także wyposażony w Cache L2 o pojemności 4 MB. Trzeba przyznać, że podsystem VRAM wygląda na niesamowicie wydajny, zaś niewykluczone jest także pojawienie się Tesli posiadające 32 GB HBM2. W kwestii energooszczędności warto zauważyć, iż współczynnik TDP podskoczył z 250 do 300W (Maxwell - Pascal), ale pobór mocy wcale nie musiał odczuwalnie wzrosnąć. Pozostaje teraz czekać na oficjalne potwierdzenie specyfikacji „cywilnych” chipów, w pierwszej kolejności najpewniej następcy GeForce GTX Titan X, który ponad wszelką wątpliwość będzie posiadał bliźniacze parametry. Premiera powinna nastąpić najpóźniej na targach Computex 2016.