Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

OpenAI uruchamia GPT-5.3-Codex-Spark na chipach Cerebras WSE-3. To pierwsza implementacja poza ekosystemem NVIDIA

Maciej Lewczuk | 14-02-2026 11:00 |

OpenAI uruchamia GPT-5.3-Codex-Spark na chipach Cerebras WSE-3. To pierwsza implementacja poza ekosystemem NVIDIAOpenAI właśnie uruchomiło GPT-5.3-Codex-Spark, lekką wersję swojego flagowego narzędzia do kodowania, która działa na procesorach Cerebras Wafer Scale Engine 3, czyli chipach wielkości talerza obiadowego zawierających 4 biliony tranzystorów. Model generuje kod z prędkością tysiąca tokenów na sekundę, czyli 15 razy szybciej od pełnego GPT-5.3-Codex. To pierwsza produkcyjna implementacja OpenAI poza ekosystemem NVIDIA.

OpenAI uruchamia pierwszy produkcyjny model na architekturze wielkości wafla krzemowego Cerebras, osiągając tysiąc tokenów na sekundę w zadaniach kodowania. To niezwykle ważna zmiana w strategii infrastrukturalnej giganta sztucznej inteligencji.

OpenAI uruchamia GPT-5.3-Codex-Spark na chipach Cerebras WSE-3. To pierwsza implementacja poza ekosystemem NVIDIA [1]

Eksperyment Anthropic za 20 000 dolarów. Szesnaście instancji Claude Opus 4.6 stworzyło kompilator C w dwa tygodnie

Codex-Spark to efekt 10-miliardowej umowy pomiędzy OpenAI a Cerebras ogłoszonej w styczniu 2026 roku, zaledwie miesiąc po tym, jak prezes NVIDII Jensen Huang publicznie skrytykował model biznesowy Sama Altmana. Jak pisaliśmy przy okazji wstrzymania stumiliardowej inwestycji, relacje między obydwiema firmami uległy znacznemu ochłodzeniu. NVIDIA nigdy nie sfinalizowała obiecanego we wrześniu pakietu infrastrukturalnego, a źródła wskazywały na niezadowolenie OpenAI z szybkości niektórych chipów NVIDII w zadaniach inference. Cerebras wchodzi właśnie w tę lukę.

OpenAI uruchamia GPT-5.3-Codex-Spark na chipach Cerebras WSE-3. To pierwsza implementacja poza ekosystemem NVIDIA [2]

Amazon MGM Studios uruchamia AI Studio. Program beta testów narzędzi AI w produkcji filmowej ruszy w marcu 2026

Wafer Scale Engine 3 to trzecia generacja układu monolitycznego o powierzchni 46 255 mm², zawierającego 900 tys. rdzeni zoptymalizowanych pod AI i 44 GB pamięci SRAM zintegrowanej bezpośrednio na chipie. W przeciwieństwie do klasycznych GPU, które polegają na zewnętrznej pamięci HBM, architektura Cerebras eliminuje wąskie gardło przepustowości, stąd spektakularne wyniki inference rzędu 2100 tokenów/s dla Llama 3.1 70B czy 3000 tokenów/s dla gpt-oss-120B. Codex-Spark osiąga tylko tysiąc tokenów na sekundę, co OpenAI tłumaczy większą złożonością modelu, niemniej to wciąż wynik niedościgniony dla tradycyjnych akceleratorów. Technologia ta sprawdziła się już w testach Mistral AI, które w grudniu 2025 wykazało przewagę Cerebras nad rozwiązaniami chmurowymi wykorzystującymi GPU NVIDIA.

Claude kontra ChatGPT. Anthropic oficjalnie rezygnuje z modelu reklamowego w chatbotach AI

To nie jedyna dywersyfikacja OpenAI od dominującego dostawcy. Firma w październiku 2025 podpisała sześciogigawatową umowę z AMD na procesory Instinct, w listopadzie zawarła 38-miliardowy kontrakt z Amazon Web Services, a od lutego ubiegłego roku projektuje własny układ ASIC we współpracy z Broadcom i TSMC, którego produkcja w litografii 3 nm ma ruszyć pod koniec 2026 roku. Równolegle NVIDIA przejęła technologię inference Groq za 20 mld dolarów, jak opisywaliśmy w grudniu. To była próba neutralizacji konkurencji, która oferowała 300-500 tokenów/s wobec 60-100 tokenów/s standardowych GPU. Teraz Cerebras osiąga wyniki dwu- czy nawet pięciokrotnie lepsze niż Groq przed przejęciem, a OpenAI ma dostęp do tej mocy w ramach wieloletniego partnerstwa.

OpenAI uruchamia GPT-5.3-Codex-Spark na chipach Cerebras WSE-3. To pierwsza implementacja poza ekosystemem NVIDIA [3]

Xcode 26.3 wprowadza Model Context Protocol i natywną obsługę autonomicznych agentów AI Claude i OpenAI

Najważniejsze jest tu rozróżnienie zastosowań. Codex-Spark nie ma konkurować z pełnym GPT-5.3-Codex w długoterminowych zadaniach wymagających głębokiego rozumowania. To narzędzie do szybkiej iteracji, refaktoryzacji, drobnych poprawek w kodzie, tam gdzie liczy się natychmiastowa odpowiedź. OpenAI wprost mówi o dwóch trybach pracy, czyli współpracy w czasie rzeczywistym (Spark) i długich zadaniach analitycznych (pełny Codex). Dla programistów różnica jest namacalna. Zamiast czekać sekundy na podpowiedź autouzupełnienia, system reaguje niemal błyskawicznie, co zmienia rytm pracy. Czy jednak w pogoni za szybkością nie poświęcono dokładności? OpenAI ostrzega, że model może wymagać weryfikacji wyników.

OpenAI uruchamia GPT-5.3-Codex-Spark na chipach Cerebras WSE-3. To pierwsza implementacja poza ekosystemem NVIDIA [4]

Źródło: Cerebras, OpenAI
Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Liczba komentarzy: 15

Komentarze:

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.