Intel Arrow Lake-S oraz Arrow Lake-HX - Charakterystyka architektury Lion Cove, Skymont, Xe-LPG oraz NPU
- SPIS TREŚCI -
W zeszłym miesiącu firma Intel przedstawiła oficjalnie mobilne procesory Lunar Lake (Core Ultra 200V), które jako pierwsze były wyposażone w nowe rdzenie Lion Cove oraz Skymont, jak również zintegrowane układy graficzne Xe2. Premiera odbyła się w Berlinie, na której byliśmy również obecni. Wydarzenie wówczas nie skupiało się jednak wyłącznie na prezentacji możliwości Lunar Lake. Zamknięta część pokazu, o której dopiero teraz możemy mówić, dotyczyła architektury stojącej za procesorami Intel Arrow Lake. W tym materiale skupimy się na omówieniu najważniejszych nowości dla desktopowych układów Arrow Lake-S oraz mobilnych Arrow Lake-HX.
Omawiamy wszystkie nowości architektury dla desktopowych procesorów Intel Arrow Lake-S oraz mobilnych Arrow Lake-HX. Układy zostaną wyposażone w rdzenie Lion Cove oraz Skymont, a także NPU 3. generacji oraz zintegrowane układy graficzne, oparte na architekturze Xe-LPG.
Intel Arrow Lake-HX - poznaliśmy specyfikację procesorów nowej generacji dla topowych laptopów do gier i pracy
Intel Arrow Lake to nowa generacja procesorów (Core Ultra 2. serii), wykorzystująca rdzenie Lion Cove (Performance) oraz Skymont (Efficient). Nadrzędnym celem firmy nie było tym razem wyśrubowanie wydajności kosztem olbrzymiego poboru mocy i ekstremalnie wysokich temperatur. Wręcz przeciwnie. Wydajność została utrzymana w wielu scenariuszach na podobnym poziomie co 14. generacja Raptor Lake Refresh (czasami jest nieco słabiej, czasami nieco wydajniej). Największa zmiana dotyczy tego jak w ogóle działają procesory Arrow Lake. Mają być znacznie bardziej energooszczędne (Compute Tile wszystkich układów Arrow Lake wytwarzany jest w procesie TSMC N3) oraz chłodniejsze od poprzedników, wpływając w ten sposób chociażby na lepszą kulturę pracy komputerów pod obciążeniem.
Intel zapowiedział szybkie porzucenie procesu technologicznego 20A. Generacja Arrow Lake wykorzysta tylko proces firmy TSMC
Procesory Intel Arrow Lake-S oraz Arrow Lake-HX składają się z kilku kafelków, połączonych ze sobą z pomocą metody Foveros 3D. Na podstawce znajdziemy Base Tile, na którym to ułożone zostały kolejne bloki: Compute Tile, GPU Tile, SoC Tile, I/O Tile oraz Filler Tile. Ten ostatni to pusty element, który ma tylko umożliwić wypełnienie niewykorzystanej powierzchni na podstawce procesora. Rozmiar podstawki Arrow Lake-S oraz Arrow Lake-HX został z kolei zmniejszony o 33% względem poprzedników. Nowe procesory korzystają z mikroarchitektury Lion Cove (P-Core) oraz Skymont (E-Core), których budowa jest zbliżona do tego, co widzieliśmy w układach Lunar Lake. Ze względu na zwiększoną liczbę rdzeni Performance, powiększeniu uległa pamięć cache L3 - do 36 MB, do której dostęp mają również rdzenie Skymont (E-Core), co nie było możliwe w poprzednich generacjach hybrydowych procesorów Intela.
Premiera procesorów Intel Lunar Lake w laptopach. Test ASUS Zenbook S 14 z Intel Core Ultra 7 258V oraz Intel ARC 140V
Rdzeń Lion Cove doczekał się wielu modyfikacji, stając się najbardziej złożonym rdzeń x86 w historii Intela. Poszerzony został front-end, gdzie teraz znajdziemy nawet 8-krotnie powiększony blok predykcji. Front-end oferuje teraz 8-drożny dekoder i 12-drożny μOP Cache (zwiększenie Micro-ops z 14 w Golden Cove do 20 w Lion Cove). W silniku Out of Order kompletnie rozdzielono bloki INT oraz VEC, nadając im całkowicie osobne harmonogramy, ale jednocześnie z możliwością bardziej efektywnego ich rozwijania w przyszłych mikroarchitekturach, w zależności od potrzeb. W przypadku silnika Out of Order, zwiększono (wszystkie zmiany są porównywane z rdzeniem Redwood Cove w Meteor Lake) Dispatch/Rename z 6 do 8, Wide Retirment z 8 do 12, a jedna z większych zmian to znaczące powiększenie portów wykonawczych - z 12 do 18. Mocno powiększono również zestaw instrukcji w oknie, a które mogą być poza kolejką (z 512 w Redwood Cove do 576 w Lion Cove). Powiększono również bloki dla liczb całkowitych - z 5 do 6. Do tego dochodzi także więcej instrukcji jump units oraz shift units, w obu przypadkach z 2 do 3, a także instrukcji typu MUL z jednej do trzech (64x64>64). W przeciwieństwie do rdzeni Lion Cove w Lunar Lake, te w Arrow Lake mają jeszcze pojemniejszy cache L2 (3 MB zamiast 2.5 MB na rdzeń), tym samym maksymalna konfiguracja Arrow Lake-S zaoferuje 24 MB cache L2.
Pomimo znaczących zmian (które z pewnością przełożą się na przyszłe generacje procesorów), IPC Lion Cove w układach Arrow Lake-S oraz Arrow Lake-HX nie jest jakiś znacząco wyższe w porównaniu do Raptor Cove z 14. generacji Raptor Lake-S Refresh. Średni wzrost IPC wynosi w tym wypadku 9%, co przekłada się na relatywnie niewielki wzrost wydajności jednowątkowej. Z drugiej strony Single Core ma być nadal na tyle wydajny, by w wielu aplikacjach wygrywać z AMD Ryzen 9 9950X, opartym na mikroarchitekturze Zen 5.
Rdzeń Skymont charakteryzuje się m.in. poszerzoną, 128-bajtową predykcją oraz znacznie przyspieszonym wyszukiwaniem kolejnych instrukcji. Wprowadzono 9-drożny dekoder (w systemie 3x3), co stanowi 50% wzrost liczby klastrów w porównaniu do poprzedniej generacji Efficient Core. Powiększono kolejkowanie μOP Queue z 64 do 96 wejść. Silnik Out-of-Order posiada teraz szerszy Allocate / Rename (z 6-drożnego w Crestmont do 8-drożnego w Skymont), dwukrotnie szerszy Retire (z 8-drożnego w Crestmont do 16-drożnego w Skymont). Out-of-Order charakteryzuje się teraz znacznie powiększonym oknem dla zestawu instrukcji (z 256 wejść w Crestmont do 416 w Skymont). Skymont otrzymał łącznie 26 portów Dispatch, w tym 8 ALU dla liczb całkowitych oraz trzy typu Jump. Efficient Core oferuje zmniejszone opóźnienia dzięki wsparciu dla instrukcji FMUL (zwielokrotnienie operacji typu FP64), FADD (dodanie 64-bitowych operacji podwójnej precyzji w rejestrze zmiennoprzecinkowym) oraz FMA (instrukcje do wykonywania operacji mnożenia i dodawania). Skymont otrzymał również natywną obsługę zaokrąglania w operacjach zmiennoprzecinkowych. Zwiększono ponadto wydajność dla obliczeń AI, dzięki dodatkowym jednostkom wykonawczym.
Pojemność pamięci cache L2 na klaster rdzeni Skymont nie uległ zmianie względem Lunar Lake. Nadal zatem otrzymujemy 4 MB na jeden klaster, składający się z czterech rdzeni E-Core. Topowa konfiguracja Arrow Lake-S i Arrow Lake-HX posiada cztery takie klastry, co przekłada się na 16 MB pamięci cache L2. Maksymalnie zatem układy te zaoferują 76 MB cache (16 MB cache L2 E-Core + 24 MB cache L2 P-Core + 36 MB cache L3). Jak natomiast wygląda wzrost IPC? Tutaj Intel już znacznie bardziej chwali się możliwościami nowych rdzeni Efficient, podobnie jak robił to przy omówieniu mikroarchitektury dla procesorów Lunar Lake. W testach jednowątkowych, opartych na liczbach całkowitych (INT), średni wzrost IPC w Skymont względem Gracemont w 14. generacji Raptor Lake-S Refresh wynosi 32%. W testach jednowątkowych, ale opartych na liczbach zmiennoprzecinkowych (FP), wzrost IPC sięga średnio aż 72%.
Zależność dla testów wielordzeniowych będzie podobna, gdy operować będziemy na obliczeniach z liczbami całkowitymi (INT). Średni wzrost IPC pomiędzy Skymont a Gracemont sięga 32%, natomiast przy obliczeniach FP jest to 55%. Jak na przejście o jedną generację do przodu, liczby dla rdzeni Efficient wyglądają bardziej niż obiecująco i nic dziwnego, że dla Intela mikroarchitektura Skymont to trochę jak wcześniejszy Raptor Cove z 13. i 14. generacji. Modyfikacji ulegnie także działanie Intel Thread Director, który będzie zbudowany teraz podobnie jak w mobilnych układach Lunar Lake. W nowej serii procesorów, zasada działania Thread Director została jeszcze bardziej uproszczona, choć dla lepszego działania wykorzystywana jest bardziej rozbudowana telemetria. Od teraz wykonywanie każdego zadania w systemie Windows 11 rozpoczynane jest na pojedynczym rdzeniu Skymont, a jeśli wymagane jest zwiększenie mocy wielowątkowej, wówczas do roboty zaprzęgnięte zostają pozostałe rdzenie Efficient. Dopiero gdy zadanie wymaga więcej mocy obliczeniowej, Thread Director przekierowuje rdzenie Performance do działania.
Przykładem działania Thread Director jest produktywność w aplikacjach Microsoft 365 (dawny Office), mowa zatem bardziej o cyklu następujących po sobie zadaniach. Na początku do wykonywania celów wykorzystane zostają rdzenie Skymont, jednak szybko następuje niemal całkowite przekierowanie na rdzenie Lion Cove - z początku działają trzy rdzenie, by później obniżyć liczbę mocno eksploatowanych rdzeni do dwóch. Intel Thread Director w Lunar Lake ma dostęp do specjalnych stref (utworzonymi przez system Windows 11), którymi mogą być wyłącznie rdzenie Efficient, Performance lub połączone zasoby Skymont oraz Lion Cove. Strefy te umożliwiają ograniczenie wykorzystywania konkretnych typów rdzeni w celu zmniejszenia poboru mocy, jeśli nie ma potrzeby by do pracy wykorzystywać wszystkie zasoby procesorów Arrow Lake.
Względem poprzedniej generacji, ulepszony został także silnik Media Engine w procesorach Intel Arrow Lake-S i Arrow Lake-HX. W przypadku dekodowania, otrzymujemy możliwość wykorzystania rozdzielczości do 8K i 60 Hz, w połączeniu z HDR i 10-bitową głębią barw. Obsługiwane są wówczas kodeki VP9, AVC, HEVC i AV1. Kodowanie odbywa się w rozdzielczości 8K i do 120 Hz, także z HDR i 10-bitową głębią kolorów. W kodowaniu obsługiwane są te same kodeki, co te przed momentem wymienione. Procesory Arrow Lake-S i Arrow Lake-HX są w stanie bezproblemowo obsługiwać monitory Full HD i Quad HD z odświeżaniem do 360 Hz włącznie. Jest także możliwość podłączenia do czterech wyświetlaczy 4K, zgodnych z HDR. Obsługiwane są także porty HDMI 2.1 oraz DisplayPort 2.1.
Intel Arrow Lake-S i Arrow Lake-HX to pierwsza generacja desktopowych i mobilnych procesorów firmy, z obsługą wyłącznie pamięci DDR5. Sam kontroler został jednak ulepszony, oferując teraz natywne obsługiwanie modułów DDR5 6400 MHz w trybie dwukanałowym. Nowe procesory można sparować z maksymalnie 192 GB DDR5 (4x 48 GB). Co istotne, Arrow Lake natywnie wspiera również pamięć z korektą błędów ECC. Jeśli chodzi o formaty pamięci, to mowa tutaj o UDIMM, SODIMM, CUDIMM oraz CSODIMM.
- SPIS TREŚCI -
Powiązane publikacje

AMD Ryzen Threadripper (PRO) 9000WX - Kolejne poszlaki wskazują na zbliżającą się premierę procesorów HEDT Zen 5
13
Procesor AMD Ryzen 7 9800X3D do kupienia w najniższej cenie od premiery. Świetna jednostka do gier dostępna poniżej MSRP
90
Intel 18A przyciąga uwagę. NVIDIA i Broadcom testują nowy proces, otwierając drogę do potencjalnej współpracy
23
TSMC zapowiada SoW-X, czyli nową erę pakowania chipów dla AI i HPC. Masowa produkcja ruszy już w 2027 roku
7