OpenAI uruchamia GPT-5.3-Codex-Spark na chipach Cerebras WSE-3. To pierwsza implementacja poza ekosystemem NVIDIA
OpenAI właśnie uruchomiło GPT-5.3-Codex-Spark, lekką wersję swojego flagowego narzędzia do kodowania, która działa na procesorach Cerebras Wafer Scale Engine 3, czyli chipach wielkości talerza obiadowego zawierających 4 biliony tranzystorów. Model generuje kod z prędkością tysiąca tokenów na sekundę, czyli 15 razy szybciej od pełnego GPT-5.3-Codex. To pierwsza produkcyjna implementacja OpenAI poza ekosystemem NVIDIA.
OpenAI uruchamia pierwszy produkcyjny model na architekturze wielkości wafla krzemowego Cerebras, osiągając tysiąc tokenów na sekundę w zadaniach kodowania. To niezwykle ważna zmiana w strategii infrastrukturalnej giganta sztucznej inteligencji.
Eksperyment Anthropic za 20 000 dolarów. Szesnaście instancji Claude Opus 4.6 stworzyło kompilator C w dwa tygodnie
Codex-Spark to efekt 10-miliardowej umowy pomiędzy OpenAI a Cerebras ogłoszonej w styczniu 2026 roku, zaledwie miesiąc po tym, jak prezes NVIDII Jensen Huang publicznie skrytykował model biznesowy Sama Altmana. Jak pisaliśmy przy okazji wstrzymania stumiliardowej inwestycji, relacje między obydwiema firmami uległy znacznemu ochłodzeniu. NVIDIA nigdy nie sfinalizowała obiecanego we wrześniu pakietu infrastrukturalnego, a źródła wskazywały na niezadowolenie OpenAI z szybkości niektórych chipów NVIDII w zadaniach inference. Cerebras wchodzi właśnie w tę lukę.
Amazon MGM Studios uruchamia AI Studio. Program beta testów narzędzi AI w produkcji filmowej ruszy w marcu 2026
Wafer Scale Engine 3 to trzecia generacja układu monolitycznego o powierzchni 46 255 mm², zawierającego 900 tys. rdzeni zoptymalizowanych pod AI i 44 GB pamięci SRAM zintegrowanej bezpośrednio na chipie. W przeciwieństwie do klasycznych GPU, które polegają na zewnętrznej pamięci HBM, architektura Cerebras eliminuje wąskie gardło przepustowości, stąd spektakularne wyniki inference rzędu 2100 tokenów/s dla Llama 3.1 70B czy 3000 tokenów/s dla gpt-oss-120B. Codex-Spark osiąga tylko tysiąc tokenów na sekundę, co OpenAI tłumaczy większą złożonością modelu, niemniej to wciąż wynik niedościgniony dla tradycyjnych akceleratorów. Technologia ta sprawdziła się już w testach Mistral AI, które w grudniu 2025 wykazało przewagę Cerebras nad rozwiązaniami chmurowymi wykorzystującymi GPU NVIDIA.
Claude kontra ChatGPT. Anthropic oficjalnie rezygnuje z modelu reklamowego w chatbotach AI
To nie jedyna dywersyfikacja OpenAI od dominującego dostawcy. Firma w październiku 2025 podpisała sześciogigawatową umowę z AMD na procesory Instinct, w listopadzie zawarła 38-miliardowy kontrakt z Amazon Web Services, a od lutego ubiegłego roku projektuje własny układ ASIC we współpracy z Broadcom i TSMC, którego produkcja w litografii 3 nm ma ruszyć pod koniec 2026 roku. Równolegle NVIDIA przejęła technologię inference Groq za 20 mld dolarów, jak opisywaliśmy w grudniu. To była próba neutralizacji konkurencji, która oferowała 300-500 tokenów/s wobec 60-100 tokenów/s standardowych GPU. Teraz Cerebras osiąga wyniki dwu- czy nawet pięciokrotnie lepsze niż Groq przed przejęciem, a OpenAI ma dostęp do tej mocy w ramach wieloletniego partnerstwa.
Xcode 26.3 wprowadza Model Context Protocol i natywną obsługę autonomicznych agentów AI Claude i OpenAI
Najważniejsze jest tu rozróżnienie zastosowań. Codex-Spark nie ma konkurować z pełnym GPT-5.3-Codex w długoterminowych zadaniach wymagających głębokiego rozumowania. To narzędzie do szybkiej iteracji, refaktoryzacji, drobnych poprawek w kodzie, tam gdzie liczy się natychmiastowa odpowiedź. OpenAI wprost mówi o dwóch trybach pracy, czyli współpracy w czasie rzeczywistym (Spark) i długich zadaniach analitycznych (pełny Codex). Dla programistów różnica jest namacalna. Zamiast czekać sekundy na podpowiedź autouzupełnienia, system reaguje niemal błyskawicznie, co zmienia rytm pracy. Czy jednak w pogoni za szybkością nie poświęcono dokładności? OpenAI ostrzega, że model może wymagać weryfikacji wyników.
Powiązane publikacje

Google chce wyciąć pół montażowni z procesu. Gemini Omni przerabia wideo po ludzku, a nie po timeline’ie
12
Microsoft umożliwi personalizację paska zadań i menu Start w Windows 11. Będzie można także zmienić funkcję przycisku Copilot
31
Microsoft testuje Low Latency Profile w Windows 11. Krótkie skoki taktowania CPU mają skrócić opóźnienia interfejsu
63
Apple iOS 26.5: aktualizacja dla serii Apple iPhone. Szyfrowane wiadomości między iOS a Androidem, choć nie dla wszystkich
25







![OpenAI uruchamia GPT-5.3-Codex-Spark na chipach Cerebras WSE-3. To pierwsza implementacja poza ekosystemem NVIDIA [1]](/image/news/2026/02/14_openai_uruchamia_gpt_5_3_codex_spark_na_chipach_cerebras_wse_3_to_pierwsza_implementacja_poza_ekosystemem_nvidia_1.jpg)
![OpenAI uruchamia GPT-5.3-Codex-Spark na chipach Cerebras WSE-3. To pierwsza implementacja poza ekosystemem NVIDIA [2]](/image/news/2026/02/14_openai_uruchamia_gpt_5_3_codex_spark_na_chipach_cerebras_wse_3_to_pierwsza_implementacja_poza_ekosystemem_nvidia_0.jpg)
![OpenAI uruchamia GPT-5.3-Codex-Spark na chipach Cerebras WSE-3. To pierwsza implementacja poza ekosystemem NVIDIA [3]](/image/news/2026/02/14_openai_uruchamia_gpt_5_3_codex_spark_na_chipach_cerebras_wse_3_to_pierwsza_implementacja_poza_ekosystemem_nvidia_3.jpg)
![OpenAI uruchamia GPT-5.3-Codex-Spark na chipach Cerebras WSE-3. To pierwsza implementacja poza ekosystemem NVIDIA [4]](/image/news/2026/02/14_openai_uruchamia_gpt_5_3_codex_spark_na_chipach_cerebras_wse_3_to_pierwsza_implementacja_poza_ekosystemem_nvidia_2.jpg)





