Arm C1 oraz Mali G1 - nowe serie rdzeni i układów graficznych dla smartfonów i tabletów. Lepsza obsługa AI i Ray Tracingu
Postęp związany z AI jest widoczny także w mobilnym świecie. Aktualnie wiele firm zmierza w stronę chipów, które będą w stanie odpowiednio dobrze, a zarazem lokalnie obsłużyć różne usługi z tego segmentu. Arm zaprezentowało nowe rdzenie z serii C1, które skupiają się właśnie na tym aspekcie, a które znajdą się na pokładzie nadchodzących procesorów dla smartfonów. Przedstawiono też układy graficzne, które oprócz lepszej obsługi AI celują w wydajniejszą obsługę Ray Tracingu.
Arm przedstawiło rdzenie z linii C1 dla mobilnych procesorów, które stawiają na lepszą lokalną obsługę AI. Do tego na pokładzie smartfonów i tabletów wkrótce pojawią się układy graficzne, który nie tylko lepiej sprawdzą się we wspomnianym aspekcie, ale będą też wydajniejsze w obsłudze Ray Tracingu.
Nowe procesory AmpereOne M dla aplikacji AI i chmurowych oferują do 192 rdzeni ARM i obsługują do 3 TB pamięci DDR5
'Platforma Arm Lumex Compute Subsystem (CSS) to zaawansowany podsystem, który skupia się na tym, aby oddać w ręce użytkowników doświadczenia związane z AI. Łączy on w sobie topowe klastry CPU, nowe, a zarazem rewolucyjne GPU (...)' - tak przedsiębiorstwo Arm opsiuje swoje rozwiązanie, w skład którego wchodzą omawiane rdzenie z serii C1, a także układy graficzne z linii Mali G1 (choć nacisk kładzie się na najwydajniejszy wariant). Wspomniane rdzenie jako pierwsze opierają się na architekturze Armv9.3, a w ich skład wchodzi kilka wariantów: C1-Ultra, C1-Premium, C1-Pro oraz C1-Nano. Nadchodzące procesory mobilne, które będą korzystały z tych rdzeni, mogą liczyć na lepszą lokalną obsługę AI, dzięki integracji z rozwiązaniem Arm Scalable Matrix Extension 2 (SME2). Jak łatwo się domyślić, flagowe rdzenie to C1-Ultra, które w szczytowym momencie mogą być wydajniejsze nawet o 25% w stosunku do rdzeni Cortex-X925 (mowa tutaj o wydajności pojedynczego rdzenia). Ponadto można oczekiwać poprawionego zarządzania energią.
*Jeśli temat nas zainteresował, to głębsze omówienie różnych terminów, takich jak CSS, czy też SME2, znajdziemy w odnośnikach, które zawarte są w tym materiale pod pełnymi nazwami. Natomiast informacje od Arm o samych rdzeniach z serii C1 są TUTAJ.
ARM ma już 40 lat. Architektura, która zasila smartfony, serwery i roboty, trafiła do ponad 250 miliardów urządzeń
Z kolei procesory oparte na rdzeniach C1-Premium będą zaliczane do "prawie-flagowych" (wydaje mi się, że dobrym porównaniem będą tutaj jednostki od Qualcomma z dopiskiem "s", np. Snapdragon 8s Gen 3), gdzie powierznia każdego rdzenia jest mniejsza o 35% od C1-Ultra. Tak więc w przypadku takich CPU można liczyć na "podobny" poziom wydajności do flagowych wersji, choć przy zmniejszonym rozmiarze. Rdzenie C1-Pro kierują się ku wyższej wydajności przy równoczesnym spoglądaniu na pobór mocy. Przy tej samej częstotliwości, co Cortex-A725, rdzenie C1-Pro mają zapewnić lepszą wydajność w grach o 16%, a zarazem podczas oglądania filmów, czy też przeglądania Internetu lub social mediów, możemy oczekiwać mniejszego poboru mocy o 11-12%, co też dobrze pokazuje pierwsza z poniższych grafik. Od strony technicznej rdzenie C1-Pro mogą liczyć na lepsze przewidywanie rozgałęzień (ang. branch prediction) oraz udoskonaloną aktualizację systemu pamięci, przez co mają się bardzo dobrze sprawdzić w obsługiwaniu wielu zadań jednocześnie (ang. multitasking).
Ostatnie z procesorowych rdzeni, czyli C1-Nano, zajmują jeszcze mniej miejsca i są o 26% bardziej energooszczędne niż Cortex-A520. Wpływ na taką sytuację ma Arm DynamIQ Shared Unit (DSU). W tym wypadku mówimy więc o chipach, które trafią na pokład smartwatchy i innych kompaktowych urządzeń. Tak naprawdę wszystkie rdzenie z serii C1 robią użytek z C1-DSU, o którym możemy się więcej dowiedzieć pod tym adresem. Dzięki niemu oszczędność energii może wynieść do 26% w porównaniu z DSU-120, z którego korzystała poprzednia generacja. Ma się on lepiej dostosowywać do różnych konfiguracji, więc np. połączenie rdzeni C1-Pro i C1-Nano zapewni lepszą wydajność (dokł. mowa o "dwukrotnej poprawie gęstości obliczeniowej) od Cortex-A720 + Cortex-A520 - ma to wpłynąć na dostarczenie zaawansowanych rozwiązań z segmentu AI do średniopółkowych urządzeń mobilnych.
Cóż, pozostało nam omówienie serii układów graficznych Mali G1, począwszy od Mali-G1 Ultra, który ma wznieść obsługę wspomnianej już technologii śledzenia promieni (od strony sprzętowej) na wyższy poziom, lepiej obsługiwać AI, a także zaoferować lepszą efektywność energetyczną. Jeśli porównamy poprzednie flagowe GPU, czyli Immortalis-G925, to możemy liczyć na 2-krotny wzrost wydajności w obsłudze Ray Tracingu, szybsze wnioskowanie w sieciach AI oraz ML o 20% ("przez nowe ścieżki obliczeniowe macierzy FP16") oraz lepszą wydajność w benchmarkach graficznych (a więc zapewne również w grach) także o 20%. W przypadku Ray Tracingu Arm wprowadziło nową, oddzielną jednostkę sprzętową o nazwie RTUv2 (Ray Tracing Unit v2), która może zapewnić o 40% więcej FPS w grach z tą technologią i ma przenieść śledzenie promieni desktopowej klasy do mobilnego świata. Modułowa konstrukcja sprawia, że RTUv2 można całkowicie wyłączyć, gdy nie zachodzi potrzeba jej używania. Oprócz Mali G1-Ultra na rynek trafią dwa inne warianty: Mali G1-Premium oraz Mali G1-Pro, które będą odpowiednio słabsze od flagowej jednostki (nie poświęcono im zbyt wiele uwagi).
Rozszerzono też pamięć podręczną drugiego poziomu (L2) i zoptymalizowano połączenia (ang. interconnects), aby poprawić wydajność i zminimalizować zjawisko bottlenecku. Wprowadzono też ulepszenia na poziomie rdzeni, dzięki którym wydajność powinna skalować się wraz ze wzrostem złożoności zadań, ale bez niepotrzebnego zwiększania zakresu mocy. Dzięki Arm Image Region Dependencies (IRD) układ graficzny Mali-G1 Ultra może lepiej obsługiwać "różne części ekranu jednocześnie". Wśród całej serii Mali G1 nie zabrakło wsparcia dla technologii upscalingu Arm Accuracy Super Resolution (Arm ASR). Korzyści z nowych odsłon układów graficznych mają odnieść również programiści - przez lepszy wgląd w aktywność GPU. Więcej dowiemy się TUTAJ.
Źródła: Arm, GSMArena, Grafika mobilna: Maxence Pira/Unsplash (edytowane)
Powiązane publikacje

Intel ma poważny problem w Ohio. Najważniejsi ludzie uciekają z projektu wartego miliardy dolarów. Co dalej z fabryką chipów?
15
Intel Core i5-110, czyli jak nastąpiło ciche przywrócenie do życia procesora z generacji Comet Lake, tyle że pod nową nazwą
29
Intel zaprzecza doniesieniom o wycofaniu z technologii szklanych substratów i utrzymuje plany komercjalizacji przed 2030 rokiem
16
Apple A19 Pro sprawdzony w Geekbench. Wydajność jednowątkowa porównywalna z chipami M4, a w środowisku Metal z CPU M2
46