Charakterystyka mikroarchitektury Lion Cove oraz Skymont dla procesorów Intel Lunar Lake oraz Arrow Lake
- SPIS TREŚCI -
Intel Skymont - Charakterystyka mikroarchitektury dla rdzenia Efficient
Podczas Intel Tech Tour w Tajpej, producent poświęcił nawet więcej czasu dla nowego rdzenia Efficient, wykorzystującego mikroarchitekturę Skymont. Jest to związane głównie z bardzo dużym wzrostem IPC, choć Intel nie byłby sobą, gdyby nie zrobił co najmniej dziwnych porównań. Te zostały bowiem (w przypadku porównania Meteor Lake i Lunar Lake) porównane na bazie rdzenia Low Power E-Core w Core Ultra 100 do E-Core w Core Ultra 200, zamiast do typowego zestawienia E-Core z jednej generacji i E-Core w drugiej generacji. Dużo ciekawej wygląda to w kontekście desktopowych procesorów Arrow Lake, gdzie IPC rdzenia Skymont zostało porównane z IPC Raptor Cove, a więc dotychczasowego rdzenia Performance dla 13. oraz 14. generacji Raptor Lake (Refresh).
Rdzeń Skymont charakteryzuje się m.in. poszerzoną, 128-bajtową predykcją oraz znacznie przyspieszonym wyszukiwaniem kolejnych instrukcji. Wprowadzono 9-drożny dekoder (w systemie 3x3), co stanowi 50% wzrost liczby klastrów w porównaniu do poprzedniej generacji Efficient Core. Powiększono kolejkowanie μOP Queue z 64 do 96 wejść. Silnik Out-of-Order posiada teraz szerszy Allocate / Rename (z 6-drożnego w Crestmont do 8-drożnego w Skymont), dwukrotnie szerszy Retire (z 8-drożnego w Crestmont do 16-drożnego w Skymont). Out-of-Order charakteryzuje się teraz znacznie powiększonym oknem dla zestawu instrukcji (z 256 wejść w Crestmont do 416 w Skymont). Skymont otrzymał łącznie 26 portów Dispatch, w tym 8 ALU dla liczb całkowitych oraz trzy typu Jump. Efficient Core oferuje zmniejszone opóźnienia dzięki wsparciu dla instrukcji FMUL (zwielokrotnienie operacji typu FP64), FADD (dodanie 64-bitowych operacji podwójnej precyzji w rejestrze zmiennoprzecinkowym) oraz FMA (instrukcje do wykonywania operacji mnożenia i dodawania). Skymont otrzymał również natywną obsługę zaokrąglania w operacjach zmiennoprzecinkowych. Zwiększono ponadto wydajność dla obliczeń AI, dzięki dodatkowym jednostkom wykonawczym.
W przypadku podsystemu pamięci cache, rdzeń Skymont charakteryzuje się teraz obecnością 4 MB pamięci cache L2 na klaster (4 rdzenie, które współdzielą cały L2), z kolei dla L1 dwukrotnie zwiększono przepustowość na każdy cykl (z 64 do 128 bajtów). Do tego dochodzi szybsza komunikacja w zakresie L1 - L1. Rdzenie Skymont zaprojektowane zostały z myślą o zaoferowaniu odpowiedniej elastyczności oraz skalowalności. W przypadku mobilnych rozwiązań (Lunar Lake), nowe rdzenie Skymont w zależności od potrzeb mogą działać jak bardziej zaawansowana wersja Low Power Island z Meteor Lake (choć Lunar Lake nie oferuje osobnych rdzeni LP E-Core, nowe rdzenie Skymont mogą wejść w tak niski stan mocy, że w razie potrzeby będą działać na podobnej zasadzie). Dla desktopów oznacza to przede wszystkim znaczący wzrost wydajności wielowątkowej w każdym scenariuszu, gdzie można skorzystać z zasobów rdzeni Efficient.
W przypadku obliczeń bazujących na liczbach całkowitych, średni wzrost IPC Skymont w porównaniu do Low Power Efficient Core w Meteor Lake (Crestmont) wynosi 38% (do testów wykorzystano SPECrate2017_int_base est / GCC), z kolei dla operacji na liczbach zmiennoprzecinkowych wzrost średniego IPC sięga 68% (także w porównaniu do Crestmont w wersji Low Power E-Core; testy przeprowadzono z wykorzystaniem SPECrate2017_fp_base est / GCC). Gdy rdzenie E-Core w Lunar Lake mogą pracować jak Low Power Island, ten sam poziom wydajności co w przypadku Meteor Lake LP E-Core Crestmont może być zaoferowany przy zaledwie 1/3 mocy. Z kolei przy tym samym poborze mocy, średni wzrost wydajności sięga 70% dla obliczeń typu Single-Thread. Szczytowo Skymont oferuje dwukrotnie lepsze osiągi. W wydajności wielowątkowej wyniki są jeszcze lepsze, choć ponownie zestawiono sobą rdzenie Skymont (4 rdzenie mogące działać jak Low Power Island) z dwoma rdzeniami LP E-Core Crestmont z bloku SoC w Meteor Lake. W tym jednak wypadku, przy tym samym poborze mocy, klaster Skymont oferuje blisko 3-krotnie wyższą wydajność, szczytowo sięgając nawet 4x.
Wracając jeszcze do IPC Skymont w kontekście desktopowych procesorów Arrow Lake. Tutaj Intel wykonał porównania do możliwości dotychczasowych rdzeni Performance z generacji Raptor Lake i Raptor Lake Refresh (Raptor Cove). Dla obliczeń opartych na liczbach całkowitych oraz dla obliczeń bazujących na liczbach zmiennoprzecinkowych, średni wzrost IPC rdzenia Effciient Skymont wynosi 2%. Według Roberta Hallocka, z którym rozmawialiśmy, nowy rdzeń Skymont w wielu zadaniach można traktować na równi z dotychczasowym rdzeniem Performance. Idąc dalej - Arrow Lake to tak naprawdę połączenie nowego rdzenia Performance z mniejszym rdzeniem Efficient, ale o wydajności takiej jak Performance Core raptem z poprzedniej generacji. Na papierze wygląda to znacznie lepiej niż przy osiągach Gracemont czy Crestmont, jednak dopiero faktyczne testy pokażą nam, czy w rdzeniu Skymont drzemie tak duży potencjał, jak stara się to przedstawić Intel.
- SPIS TREŚCI -
Powiązane publikacje

AMD Ryzen Threadripper (PRO) 9000WX - Kolejne poszlaki wskazują na zbliżającą się premierę procesorów HEDT Zen 5
13
Procesor AMD Ryzen 7 9800X3D do kupienia w najniższej cenie od premiery. Świetna jednostka do gier dostępna poniżej MSRP
90
Intel 18A przyciąga uwagę. NVIDIA i Broadcom testują nowy proces, otwierając drogę do potencjalnej współpracy
23
TSMC zapowiada SoW-X, czyli nową erę pakowania chipów dla AI i HPC. Masowa produkcja ruszy już w 2027 roku
7