NVIDIA Lovelace – nieoficjalne informacje o specyfikacji układu graficznego AD102 opartego na architekturze wykonanej w 5 nm
W tym roku oficjalnie zadebiutowała nowa architektura Nvidia Ampere, a już pojawiają się doniesienia o następcy. Do niedawna wydawało się, że po niej ukażą się układy graficzne bazujące na Hopper, ale plany Zielonych podobno uległy drastycznym zmianom. Rzeczona architektura zaliczyła znaczną obsuwę, a w zamian najpierw pojawi się Nvidia Lovelace, wykorzystująca tradycyjną, monolityczną budowę. Producent według nieoficjalnych doniesień od dłuższego czasu posługuje się nazwą kodową „ADxxx” dla swoich nadchodzących GPU. Nvidia Lovelace zostanie wykonana w 5-nanometrowej litografii, czyli w tym samym procesie technologicznym, w którym miała być wytworzona architektura Hopper. Do sieci trafiły nowe przecieki o nadchodzącym układzie graficznym AD102, który może mieć aż 18432 rdzeni CUDA.
Poznaliśmy pierwsze, nieoficjalne informacje o specyfikacji architektury Nvidia Lovelace, wykonanej w 5-nanometrowym wymiarze technologicznym. Pełny układ graficzny AD102 może mieć 12 klastrów GPC, 72 klastrów TPC, 144 bloków SM, które przełożyłyby się na aż 18432 rdzeni CUDA.
Co nas czeka po Ampere? Kolejna generacja układów graficznych NVIDIA to Lovelace. Architektura Hopper zaliczy opóźnienie
Zgodnie z najnowszymi plotkami, Lovelace będzie następną generacją kart graficznych firmy Nvidia. Według znanego insidera, kopite7kimiego, układ AD102, który zostanie zastosowany w topowych GPU (prawdopodobnie w GeForce z serii RTX 4000), ma mieć strukturę 12x6 (GA102 ma 7x6), co przełożyłoby się w pełnym rdzeniu na 12 klastrów przetwarzania grafiki (ang. Graphics Processing Cluster), 72 klastrów przetwarzania tekstur (ang. Texture Processing Cluster) i 144 multiprocesorów strumieniujących (ang. Streaming Multiprocessor).
So, nVidia's AD102 chip maybe is like:
— 3DCenter.org (@3DCenter_org) December 28, 2020
12 GPC
72 TPC
144 SM
18'432 FP32 units
~66 TFlops FP32 power (on 1.8 GHz) https://t.co/A8OnUktE1s
NVIDIA GeForce RTX 3000: nowe informacje o architekturze Ampere
Taka liczba SM oznaczałaby aż 18432 rdzeni CUDA w pełnym układzie AD102 (144x128). Dla porównania rdzeń Ampere GA102 może pochwalić się 84 blokami SM i 10752 rdzeniami CUDA (RTX 3090 ma ich 10496), a więc prawie dwa razy mniejszą liczbą. Przy taktowaniu na poziomie 1,8 GHz wydajność w obliczeniach pojedynczej precyzji (FP32) mogłaby wynieść zawrotne 66,4 TFLOPS. W przypadku pełnego rdzenia GA102 mowa o „zaledwie” 38,7 TFLOPS. Nie jest jasne, kiedy karty graficzne GeForce RTX 4000, mające opierać się według pogłosek na omawianej architekturze Nvidia Lovelace, miałyby trafić na rynek. W każdym razie nie stanie się to prędzej niż pod koniec przyszłego roku albo – co bardziej prawdopodobne – w 2022 roku.