MoE
Alibaba Qwen 3.5 demoluje GPT-5.2 i Claude, a waży dwa razy mniej. Pokonuje amerykańską konkurencję za ułamek kosztów
Alibaba Cloud wypuściło model Qwen 3.5-397B-A17B, który ma zamienić globalny wyścig AI w starcie chińskiego open source i zamkniętych rozwiązań z Doliny Krzemowej. Nowy flagowiec wykorzystuje rzadką kombinację liniowej uwagi typu Gated Delta Networks z architekturą Mixture-of-Experts. Efekt? Wydajność zbliżona do GPT-5.2 czy Claude Opus 4.5, ale przy koszcie o 60 procent niższym i prędkości dekodowania nawet 19-krotnie wyższej.
ZAYA1 pierwszym modelem Mixture-of-Experts wytrenowanym całkowicie na GPU AMD Instinct MI300X lepszym od Llama-3
AMD przekroczyło próg, którego nie spodziewaliśmy się zobaczyć tak szybko. Startup Zyphra we współpracy z "czerwonymi" i IBM Cloud wytrenował ZAYA1, pierwszy duży model językowy typu Mixture-of-Experts stworzony całkowicie na platformie AMD, bez udziału układów NVIDII. To nie tylko techniczne osiągnięcie, ale potencjalnie punkt zwrotny w rywalizacji o rynek treningów AI wartych setki miliardów dolarów. Czy AMD z Instinct MI300X jest wiarygodną alternatywą?



























Recenzja karty graficznej PNY GeForce RTX 5080 Slim OC - Chłodzenie zajmujące dwa sloty zwiastuje kłopoty?
Test wydajności 007 First Light - Jaka karta graficzna do tajnych misji? Kuzyn Borewicza ma duże wymagania
AMD FSR 4.1 oficjalnie zmierza do kart graficznych Radeon RX 7000. Nowości trafią w 2027 roku także dla kart Radeon RX 6000
Test kart graficznych AMD Radeon RX 9070 GRE vs NVIDIA GeForce RTX 5070 - Trochę za późno, trochę za słabo, trochę za drogo
Myślałeś, że karty dźwiękowe PCIe już wymarły? Creative Sound Blaster AE-X wraca do gry o pecetowe audio