ZAYA1 pierwszym modelem Mixture-of-Experts wytrenowanym całkowicie na GPU AMD Instinct MI300X lepszym od Llama-3

Maciej Lewczuk | 25-11-2025 12:00 |

Procesory

ZAYA1 pierwszym modelem Mixture-of-Experts wytrenowanym całkowicie na GPU AMD Instinct MI300X lepszym od Llama-3 AMD przekroczyło próg, którego nie spodziewaliśmy się zobaczyć tak szybko. Startup Zyphra we współpracy z "czerwonymi" i IBM Cloud wytrenował ZAYA1, pierwszy duży model językowy typu Mixture-of-Experts stworzony całkowicie na platformie AMD, bez udziału układów NVIDII. To nie tylko techniczne osiągnięcie, ale potencjalnie punkt zwrotny w rywalizacji o rynek treningów AI wartych setki miliardów dolarów. Czy AMD z Instinct MI300X jest wiarygodną alternatywą?

Model językowy ZAYA1 to pierwszy dowód, że platforma AMD jest w pełni dojrzała do trenowania najbardziej zaawansowanych modeli AI na skalę produkcyjną bez kompromisów w kwestii wydajności.

Model ZAYA1 to więcej niż kolejny duży model językowy. Jego trening od początku do końca odbył się na 128 węzłach obliczeniowych wyposażonych w akceleratory AMD Instinct MI300X połączone siecią AMD Pensando Pollara 400 w infrastrukturze IBM Cloud. Całość działała wykorzystując otwarty stos oprogramowania ROCm. Dla AMD to historyczny moment, gdyż po raz pierwszy ktoś udowodnił, że można wytrenować zaawansowany model AI na skalę produkcyjną bez konieczności sięgania po karty NVIDII.

Technologia Mixture-of-Experts, zastosowana w ZAYA1, działa jak zespół specjalistów zamiast jednego uniwersalnego eksperta. Model składa się z 8,3 mld parametrów, ale w każdym momencie aktywnych jest tylko 760 mln. Wyobraźmy sobie to jak konsylium lekarskie, gdzie zamiast pytać wszystkich naraz, router kieruje zapytanie tylko do tych ekspertów, którzy znają się na konkretnym zagadnieniu. To jak posiadanie ośmiu specjalistycznych modeli, gdzie inteligentny system wybiera odpowiednią kombinację na podstawie typu zadania.

Wyniki benchmarków pokazują, że ZAYA1-base dorównuje lub przewyższa modele takie jak Llama-3-8B (Meta), OLMoE czy nawet zbliża się do wydajności Qwen3-4B (Alibaba) i Gemma3-12B (Google) w zadaniach związanych z rozumowaniem, matematyką i programowaniem. To imponujące, zważywszy na znacznie mniejszą liczbę aktywnych parametrów. Istotną rolę odegrały tu 192 GB pamięci HBM3 w każdym Instinct MI300X. Pozwoliło to uniknąć kosztownego dzielenia ekspertów między GPU, co upraszcza architekturę i zwiększa przepustowość. AMD i Zyphra zgłaszają także 10-krotnie szybszy czas zapisywania punktów kontrolnych modelu dzięki zoptymalizowanemu I/O w ROCm. W praktyce treningowej, gdzie awarie węzłów mogą kosztować dni pracy, to różnica między sukcesem a katastrofą. Klaster osiągnął ponad 750 petaflopów wydajności treningowej, a każdy węzeł dysponował 3,2 Tb/s przepustowości sieciowej dzięki ośmiu kartom Pensando Pollara 400 w topologii rails-only.

Dla AMD to także dowód dojrzałości całego ekosystemu. W poprzednich latach ROCm był krytykowany za niestabilność i problemy z kompatybilnością. Teraz Zyphra potwierdza, że platforma jest wystarczająco rozwinięta do produkcyjnych wdrożeń. To bezpośrednia odpowiedź na dominację CUDA i NVIDIA H100. MI300X ma przewagę w przepustowości pamięci (5,3 TB/s vs 4,8 TB/s w H200), co w zadaniach wymagających obsługi modeli z dużą liczbą parametrów daje wyraźną przewagę. Pozostaje pytanie o skalę. IBM i AMD zapowiadają rozbudowę klastra w 2026 roku. Jeśli ZAYA1 to dopiero początek, a kolejne generacje Instinct (MI325X już dostępny, MI350 zapowiedziany) będą kontynuować tę trajektorię, NVIDIA może po raz pierwszy od lat stanąć przed realną konkurencją w segmencie treningowym. To może zmusić Jensena Huanga do bardziej agresywnej polityki cenowej, co ostatecznie będzie korzystne dla całej branży AI.

Źródło: AMD, Zyphra Technical Report (arXiv)

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

AMD Ryzen 7 5800X3D 10th Anniversary Edition różni się od oryginału. Konieczne były drobne zmiany w konstrukcji

1 mikrometr między chipami? CEA-Leti pokazało, gdzie naprawdę zaczyna się następna wojna półprzewodników

AMD Ryzen 7 7700X3D już oficjalnie i z ceną. Firma zapowiada wydłużenie życia socketu AM5 co najmniej do 2029 roku

NVIDIA RTX Spark to układ łączący GPU Blackwell i rdzenie CPU ARM, przeznaczony dla laptopów i desktopów

Qualcomm Snapdragon C - Producent ogłosił nowy układ SoC dla tanich laptopów, ale specyfikacja może okazać się rozczarowaniem

Liczba komentarzy: 10

Komentarze:

Załaduj komentarze

ZAYA1 pierwszym modelem Mixture-of-Experts wytrenowanym całkowicie na GPU AMD Instinct MI300X lepszym od Llama-3

Model językowy ZAYA1 to pierwszy dowód, że platforma AMD jest w pełni dojrzała do trenowania najbardziej zaawansowanych modeli AI na skalę produkcyjną bez kompromisów w kwestii wydajności.

Powiązane publikacje

AMD Ryzen 7 5800X3D 10th Anniversary Edition różni się od oryginału. Konieczne były drobne zmiany w konstrukcji

1 mikrometr między chipami? CEA-Leti pokazało, gdzie naprawdę zaczyna się następna wojna półprzewodników

AMD Ryzen 7 7700X3D już oficjalnie i z ceną. Firma zapowiada wydłużenie życia socketu AM5 co najmniej do 2029 roku

NVIDIA RTX Spark to układ łączący GPU Blackwell i rdzenie CPU ARM, przeznaczony dla laptopów i desktopów

Qualcomm Snapdragon C - Producent ogłosił nowy układ SoC dla tanich laptopów, ale specyfikacja może okazać się rozczarowaniem

Komentarze:

Test kart graficznych AMD Radeon RX 9070 GRE vs NVIDIA GeForce RTX 5070 - Trochę za późno, trochę za słabo, trochę za drogo

Jaki komputer do gier kupić? Polecane zestawy komputerowe na czerwiec 2026. Komputery gamingowe w różnych cenach

Test Intel XeSS Multi Frame Generation na Intel ARC B580. Wpływ działania generatora klatek na opóźnienia w grach

Test procesora AMD Ryzen 5 7500F - Najbardziej opłacalny procesor dla platformy AM5. Idealny do tanich zestawów gamingowych

Recenzja Genesis Nitro 800. Obszerny i solidny fotel gamingowy z wszechstronną regulacją podłokietników i funkcją bujania

Microsoft Scout wchodzi do testów. Nowy agent dla Microsoft 365 ma więcej swobody niż Copilot, ale dostaje też krótszą smycz

Co ciekawego pokazała firma FSP na targach Computex 2026? Zasilacz o mocy 3300 W, nowe obudowy i systemy chłodzenia

Alphabet stawia miliardy dolarów na stole dla AI. Firma oferuje swoje akcje, aby zainwestować w sztuczną inteligencję

AMD Ryzen 7 5800X3D 10th Anniversary Edition różni się od oryginału. Konieczne były drobne zmiany w konstrukcji

SkyShowtime – filmowe i serialowe nowości VOD na czerwiec 2026. Wśród premier Wicked: Na dobre, Agencja, Bugonia i Morfeusz

Recenzja karty graficznej PNY GeForce RTX 5080 Slim OC - Chłodzenie zajmujące dwa sloty zwiastuje kłopoty?

Test wydajności 007 First Light - Jaka karta graficzna do tajnych misji? Kuzyn Borewicza ma duże wymagania

AMD FSR 4.1 oficjalnie zmierza do kart graficznych Radeon RX 7000. Nowości trafią w 2027 roku także dla kart Radeon RX 6000

Test kart graficznych AMD Radeon RX 9070 GRE vs NVIDIA GeForce RTX 5070 - Trochę za późno, trochę za słabo, trochę za drogo

Myślałeś, że karty dźwiękowe PCIe już wymarły? Creative Sound Blaster AE-X wraca do gry o pecetowe audio

O portalu PurePC

Najważniejsze

Znajdź PurePC na