AMD Ryzen 9000 i Ryzen AI 300 - Charakterystyka mikroarchitektury Zen 5 dla procesorów nowej generacji
Jeszcze w tym miesiącu do sprzedaży trafią zarówno desktopowe procesory AMD Ryzen 9000 z rodziny Granite Ridge jak również pierwsze notebooki z układami AMD Ryzen AI 300 z serii APU Strix Point. W obu przypadkach mamy do czynienia z nową mikroarchitekturą Zen 5, która ma odznaczać się przede wszystkim lepszą efektywnością energetyczną względem Zen 4. Jakie jeszcze zmiany poczyniono w Zen 5 i czy jest w ogóle czym się chwalić? Podczas konferencji AMD Zen 5 Tech Day w Los Angeles, przedstawiciele firmy przedstawili nam więcej szczegółów, a przy okazji dowiedzieliśmy się jakich różnic oczekiwać pomiędzy Zen 5 oraz Zen 5c.
Podczas prezentacji AMD Zen 5 Tech Day w Los Angeles poznaliśmy więcej szczegółów na temat mikroarchitektury Zen 5, która jest sercem procesorów Granite Ridge (Ryzen 9000) oraz Strix Point (Ryzen AI 300).
AMD Ryzen AI 300 i Ryzen 9000 - Ogólna charakterystyka procesorów Strix Point oraz Granite Ridge dla PC
Nadchodzące procesory AMD Ryzen 9000 oraz Ryzen AI 300 wykorzystują przebudowaną mikroarchitekturę Zen 5, charakteryzującą się m.in. bardziej rozbudowaną i dokładniejszą predykcją rozgałęzień, wyższą przepustowością dzięki szerszym potokom i wektorom oraz dalszymi modyfikacjami projektu rdzenia, wpływającymi na zwiększenie efektywności przy wykonywaniu wielu zadań równocześnie oraz sprawniejszym przetwarzaniu danych. Zen 5 oferuje m.in. maksymalnie dwukrotnie wyższą przepustowość dla instrukcji front-end, zwiększoną przepustowość transferu danych pomiędzy poszczególnymi poziomami pamięci cache oraz usprawnioną wydajność AI, m.in. dzięki dalszej obsłudze instrukcji AVX-512.
AMD RDNA 3.5 - Odświeżona architektura GPU dla procesorów Ryzen AI 300 opracowana z myślą o energooszczędności
AMD Zen 5 oferuje m.in. podwojone instrukcje procesora typu fetch, dwa 4-drożne bloki dekodowania oraz dwa 6-drożne bloki μOP Cache. Zen 5 charakteryzuje się ponadto 8-drożnym blokiem Dispatch (poszerzonym względem Zen 4 o 33%), w którym instrukcje typu Macro-ops są przenoszone z frond-endu do obszaru Out-of-Order. Rozbudowana w taki sposób predykcja rozgałęzień ma charakteryzować się niższymi opóźnieniami, większą dokładnością oraz przepustowością w transferze danych. Poszerzono również silnik wykonawczy i w tym wypadku także mowa o 8-drożnym bloku dispatch/retire.
AMD Ryzen 9000 oraz AMD Ryzen AI 300 - pełna specyfikacja procesorów Zen 5 Granite Ridge i Strix Point dla PC
O 50% zwiększono liczbę jednostek arytmetyczno-logicznych (z 4 do 6), co jest pierwszą zmianą od czterech generacji Zen 5. Tym samym AMD idzie śladami Intela, który w ostatnich generacjach rdzeni Performance także zwiększył liczbę ALU. Zen 5 oprócz powiększenia liczby ALU otrzymał również bardziej zunifikowany scheduler pod obsługę ALU. Na pokładzie Zen 5 znajdziemy ponadto 4 jednostki AGU (jednostki służące do obliczania adresów pamięci, pod które procesor ma się odwołać, np. w celu pobrania lub zapisu danych). Zwiększono również okno dla wykonawczych instrukcji dla procesora. Zmniejszone opóźnienia w transferze danych mają być możliwe m.in. dzieki obsłudze instrukcji FMUL, odpowiadających za zwielokrotnienie operacji typu FP64; FADD (dodanie 64-bitowych operacji podwójnej precyzji w rejestrze zmiennoprzecinkowym) oraz FMA (instrukcje do wykonywania operacji mnożenia i dodawania).
Mikroarchitektura Zen 5 to również pierwsza od lat, w której AMD powiększyło cache L1-D (Data) z 32 KB 8-Way do 48 KB 12-Way. Producent chwali się nie tylko podwojoną, maksymalną przepustowością do pamięci cache L1, ale również zmodernizowanym i ulepszonym pobieraniem wstępnym pamięci podręcznej (technika mająca na celu zwiększenie wydajności procesora poprzez pobieranie instrukcji lub danych z pierwotnego magazynu lub wolniejszej pamięci do szybszej pamięci lokalnej zanim będzie to faktycznie potrzebne). Nie brakuje ponadto pełnego wsparcia dla instrukcji AVX-512 z 512-bitową ścieżką dla danych.
Jakie są z kolei faktyczne różnice pomiędzy Zen 5 oraz Zen 5c? Okazuje się, że mniejsze niż można by przypuszczać. Rdzeń Zen 5c jest tylko nieco mniejszy od Zen 5, ale jednocześnie większy od Zen 4c (niestety dokładnych danych o powierzchni Zen 5 oraz Zen 5c nie otrzymaliśmy podczas AMD Zen 5 Tech Day). IPC dla Zen 5c jest takie samo jak dla Zen 5, co wiąże się z wykorzystaniem 1:1 tej samej mikroarchitektury. Wszystko co znajduje się w Zen 5, jest także integralną częścią Zen 5c. Nawet zegary są identyczne (stąd w specyfikacji AMD nie podaje np. osobnego taktowania dla Zen 5 oraz Zen 5c, bo jest ono identyczne). Wyższa efektywność energetyczna w połączeniu z technologią budowania mniejszych rdzeni, dany procesor może posiadać ich więcej na pokładzie w porównaniu do klasycznych rdzeni Zen 5. Sam wzrost IPC rdzenia Zen 5 względem Zen 4 to średnio 16%. W przypadku obliczeń, w których wykorzystywane jest uczenie maszynowe, wzrost wydajności jednowątkowej pomiędzy Zen 4 i Zen 5 jest jednak znacznie większy i wynosi 32%.
Jedną z różnic pomiędzy platformami AMD Granite Ridge oraz Strix Point, jest liczba linii PCIe. W przypadku desktopowych procesorów, producent oddaje do dyspozycji 20 linii PCIe (5.0), natomiast w przypadku Strix Point jest to 16 linii PCIe (4.0). Skąd wynika różnica? Wszystko rozbija się przede wszystkim o kwestie ekonomiczne, a więc koszt kompletnej platformy. W trakcie badań i testów, inżynierowie AMD doszli do wniosku, że 16 linii PCIe dla tego typu procesorów w laptopach będzie obecnie wystarczającą liczbą, z drugiej strony zmniejszono nie tylko koszt produkcji procesorów, ale również wpłynęło na dalsze obniżenie poboru mocy.
Powiązane publikacje

Intel Arrow Lake Refresh. Odświeżone procesory Core Ultra 200S będą jeszcze mniej odświeżone niż sądziliśmy
49
Procesory AMD Threadripper PRO 9000WX oraz układ Radeon AI PRO R9700 już za moment trafią na rynek
4
Niestabilny chip AMD Ryzen wcale nie musi nadawać się do kosza. YouTuber udowadnia, że pomóc może obniżenie taktowania
73
Intel Titan Lake wprowadzi zunifikowaną architekturę rdzeni bazującą na Arctic Wolf E-Core zamiast rozwiązań P-Core/E-Core
33