AMD Vega - Prezentacja nowej architektury kart graficznych
Premiera architektury VEGA opracowywanej na potrzeby kolejnej generacji kart graficznych Radeon, będzie jednym z najważniejszych tegorocznych wydarzeń w sektorze komponentów, którego wyczekujemy z wielkimi nadziejami podobnie jak procesorów Ryzen. Dzisiaj firma AMD ujawniła kilka szczegółów dotyczących tego pierwszego rozwiązania. Całość jest przygotowywana nie tylko z myślą o cyfrowej rozrywce, ale również wirtualnej rzeczywistości, projektowaniu oraz uczeniu maszynowym - będzie zatem narzędziem uniwersalnym. Mimo wszystko, firma wyraźnie podkreśla ogromny wzrost wydajności graficznej, zawdzięczany fundamentalnym zmianom w architekturze, więc amatorzy gier komputerowych prawdopodobnie otrzymają godnego konkurenta dla Pascali. Oprócz tego zapowiada się rewolucja w podsystemie pamięci, bowiem GDDR5 i HBM postanowiono odesłać na emeryturę.
Od razu uprzedzam - AMD nie pokazało gotowych kart graficznych na rdzeniach VEGA, tylko zrobiło prezentację architektury, więc informacji czy będziemy mieli wreszcie „pogromcę tytanów” tutaj nie znajdziecie. Jedyne co możemy przeanalizować to aspekty technologiczne. Wyniki nawet jeśli się gdzieniegdzie przewijały, nie pozwalały wyciągnąć żadnych daleko idących wniosków, chyba że weźmiemy za wyznacznik krótkie urywki Star Wars: Battlefront. Produkty wykorzystujące nową architekturę pojawią się na rynku w pierwszej połowie 2017 roku, kiedy dokładniej - nie wiadomo. Późno? Uważam podobnie, zwłaszcza iż NVIDIA będzie prawdopodobnie miała przygotowaną odpowiedź, chociaż niekoniecznie opartą o nowe rozwiązania, tylko ulepszone rdzenie Pascal. Zresztą, brak prezentacji GeForce GTX 1080 Ti podczas konferencji na tragach CES 2017, świadczy chyba o wyczekiwaniu na ruchy przeciwnika.
Pamięci HBM2 i kontroler HBBC
Karty graficzne bazujące na architekturze AMD VEGA otrzymają maksymalnie 16 GB HBM2, jednak należy się również spodziewać wersji skromniej wyposażonych, bowiem HBM2 jest stosunkowo drogim rozwiązaniem. Zresztą, taka monstrualna ilość pamięci nie będzie potrzebna nawet wymagającemu graczowi. Wstawienie HBM2 zaowocowało natomiast kilkoma ważnymi zmianami. Klasyczny kontroler pamięci zastąpiono HBBC (High-Bandwidth Cache Controller), dodając jednocześnie cache o wysokiej przepustowości, którego funkcję pełnią moduły HBM2 zintegrowane w obudowie układu graficznego. Pamięć podręczną L2 udostępniono teraz rasteryzatorowi (pixel engine), jaki dotychczas najpierw korzystał z własnych zasobów (L1), a później poprzez kontroler czerpał z pamięci zewnętrznej. Układ może również działać z wieloma rodzajami pamięci o wielkości adresowej dochodzącej do 512 TB, operując na 48-bitowej wirtualnej przestrzeni adresowej. Co więcej, HBCC może łączyć się z zewnętrznymi magazynami, a także przenosić dane między pamięcią lokalną i zewnętrzną (warto poczytać o Radeon Pro SSG). Jeśli chodzi o bardziej przyziemne sprawy, to modułami fizycznie zainstalowanymi na kartach graficznych będą ułożone w stosach 4-gigabajtowe HBM2, wyprzedzające swoich poprzedników wydajnością i pojemnością, bowiem dwukrotnemu zwiększeniu ulegnie taktowanie każdego 128-bitowego interfejsu. Z kolei NVRAM pozwala na "czerpanie zasobów" z pamięci Flash albo 3D XPoint umieszczonych w slotach PCI-E, jako swoistego brudnopisu.
Silnik geometryczny i Next Generation Compute Unit
Inżynierowie AMD wprowadzili na potrzeby architektury VEGA nowy programowalny silnik geometryczny, który będzie 2,6 raza szybszy od podobnego rozwiązania stosowanego w Radeonie Fury X (Fiji), czyli zamiast 4 przetworzy maksymalnie 11 wielokątów (czemu nie 12, będące wielokrotnością 4, tego w sumie nie wyjaśniono). Tutaj można oczekiwać już wymiernych korzyści w grach komputerowych. Silnik cechuje też ulepszony mechanizm kontroli obciążenia, bowiem sterowany będzie przez inteligentny "dystrybutor" zapewniający mu stabilną wydajność. Modyfikacjom ulegnie także podstawowy blok architektury GCN. Chociaż jednostka CU nadal będzie dysponować 64 procesorami strumieniowymi, wykonując dwie 32-bitowe operacje w jednym cyklu zegara, to VEGA bazować będzie na usprawnionych blokach nazwanych NCU (Next Generation Compute Unit). Nowe jednostki mogą wykonywać obliczenia o zmiennej precyzji, jak również działać w kilku trybach: 1x 32-bit, 1x 16-bit, 2x 16-bit (opcja znana jest bodajże z konsoli PlayStation 4 PRO). Warto nadmienić, że pierwsze rozwiązania tego rodzaju AMD wdrożyło już wcześniej w Polarisach. Niepotwierdzone plotki mówią jeszcze o wyłączaniu zasilania i/lub redukcji taktowania w nieużywanych procesorach strumieniowych, co powinno poprawić ogólną energooszczędność układów.
Primitive shaders i resteryzacja
VEGA potrafi także wykorzystywać primitive shaders, realizujące funkcje vertex oraz geometry shaders (transformacja wierzchołków i obrabianie brył), jednak przy użyciu mniejszej ilości zasobów. O wyborze metody wykonywania shaderów może decydować sterownik, ale programistom primitive shaders będą prawdopodobnie udostępnione do bezpośredniego użytku za pośrednictwem Vulkan i DirectX 12. Jakie dokładnie korzyści to przyniesie trudno dzisiaj oszacować. Zmiany poczyniono również w mechanizmie resteryzacji - dzięki dostępowi do pamięci podręcznej L2, współdzielonej z jednostkami NCU oraz silnikiem geometrycznym, układ graficzny szybciej wyszukuje dane z konkretnego obszaru ekranu. Wszystko co potrzebne znajduje się przecież w obrębie pamięci podręcznej L2. Pozwoli to zarazem zwiększyć energooszczędność VEGI. Zastosowano tutaj również rasteryzator kafelkowy, mający pewne elementy wspólne z ostatnimi architekturami NVIDII. Jak to działa? Ekran podzielony jest na obszary dla których chip przechowuję zbiór widocznych wielokątów oraz instrukcji. Zaawansowany silnik wyświetlania wykorzystuje nowy mechanizm kontroli pikseli oparty na technologii DSBR (Draw Stream Binning Rasterizer), umożliwiającego obsługę pikseli w trybie „fetch once, shade once” dzięki zastosowaniu wbudowanego systemu wstępnego usuwania niewidocznych pikseli z finalnie prezentowanej sceny.