Eksperyment Anthropic za 20 000 dolarów. Szesnaście instancji Claude Opus 4.6 stworzyło kompilator C w dwa tygodnie
Anthropic zaprezentowało eksperyment, który na pierwszy rzut oka wygląda imponująco. Szesnaście instancji modelu Claude Opus 4.6 samodzielnie zbudowało kompilator języka C zdolny do kompilacji jądra systemu Linux. Dwa tygodnie pracy autonomicznych agentów AI za niespełna 20 tys. dolarów. To osiągnięcie, które na tle tradycyjnego rozwoju kompilatorów trwającego dekady może wydawać się rewolucyjne.
Szesnaście instancji Claude Opus 4.6 zbudowało funkcjonalny kompilator C w dwa tygodnie, ale projekt ujawnił zarówno potencjał, jak i wyraźne granice autonomicznego kodowania AI.
Claude kontra ChatGPT. Anthropic oficjalnie rezygnuje z modelu reklamowego w chatbotach AI
Nicholas Carlini, badacz z zespołu Safeguards w firmie Anthropic, wykorzystał nową funkcję Agent Teams dostępną w modelu Claude Opus 4.6. System uruchomił 16 niezależnych instancji AI, z których każda działała we własnym kontenerze Docker, miała dostęp do wspólnego repozytorium Git i bez centralnej koordynacji wybierała zadania do realizacji. Mechanizm był prosty. Agenty rezerwowały zadania, tworząc specjalne pliki, pisały kod w języku Rust i same naprawiały błędy przy łączeniu swoich prac. Gdy wszystko było gotowe, automatycznie wysyłały poprawki do głównego folderu projektu. W ciągu niemal 2000 sesji Claude Code, pochłaniając 2 mld tokenów wejściowych i generując 140 mln tokenów wyjściowych, system wytworzył kompilator zdolny do kompilacji Linuksa 6.9 na architekturach x86, ARM i RISC-V.
Xcode 26.3 wprowadza Model Context Protocol i natywną obsługę autonomicznych agentów AI Claude i OpenAI
Rezultat faktycznie jest funkcjonalny. Kompilator osiąga 99-procentowy wskaźnik zaliczenia testów GCC torture suite, kompiluje projekty takie jak PostgreSQL, SQLite, Redis czy FFmpeg, a nawet przechodzi ostateczny test każdego kompilatora C, czyli uruchamia grę Doom. Jednak lista ograniczeń szybko sprowadza ten sukces na ziemię. Wygenerowany kod jest wyraźnie wolniejszy od tego, który wypluwa GCC nawet z wyłączonymi optymalizacjami. Kompilator nie radzi sobie z 16-bitowym trybem x86 potrzebnym do bootowania Linuksa i musi w tym fragmencie wywoływać GCC. Nie ma własnego asemblera ani linkera. Nowe funkcje regularnie psuły istniejący kod, a Opus 4.6 nie był w stanie samodzielnie naprawić wszystkich problemów.
Siqi Chen stworzył wtyczkę dla Claude, która obchodzi detektory tekstów AI używając zasad Wikipedii
Carlini otwarcie przyznaje, że to niemal granica możliwości obecnego modelu, a projekt był celowo dobrany jako idealny dla AI. Specyfikacja języka C jest znana od dekad, istnieją gotowe zestawy testów, a można weryfikować wyniki względem sprawdzonego GCC. Większość rzeczywistych projektów nie ma żadnej z tych zalet. W kontekście wcześniejszych doświadczeń z narzędziami AI wspierającymi programowanie, od asystentów typu GitHub Copilot po modele Mistral Devstral 2, ten eksperyment pokazuje zarówno skalę postępu, jak i najważniejsze bariery. Jak zauważyliśmy przy okazji raportu JetBrains 2025, 85 proc. deweloperów regularnie używa AI do kodowania, ale sceptycyzm wobec jakości generowanego kodu rośnie. Carlini wprost przyznaje, że perspektywa programistów wdrażających kod, którego nigdy osobiście nie zweryfikowali, budzi niepokój. Autonomiczne systemy łatwo przechodzą testy, ale to rzadko oznacza, że praca jest naprawdę skończona. Najważniejszym pytaniem jest nie "czy kod działa", ale "czy wiemy, co ten kod faktycznie robi".
Powiązane publikacje

EA szykuje Battlefield 6 i inne gry na procesory NVIDIA N1/N1X i Qualcomm Snapdragon X2, portując Javelin Anticheat na ARM64
28
Google rozwiązuje spór z Epic Games. Android otworzy się bardziej na sklepy z aplikacjami i stanie się korzystniejszy dla twórców
22
GrapheneOS już nie tylko na Pixelach. Mobilny system zmierza na smartfony Motoroli, z którą fundacja nawiązała partnerstwo
35
Siri miała być najlepszym asystentem AI. Skończyło się na tym, że Apple wynajmuje infrastrukturę od swojego głównego rywala
25







![Eksperyment Anthropic za 20 000 dolarów. Szesnaście instancji Claude Opus 4.6 stworzyło kompilator C w dwa tygodnie [1]](/image/news/2026/02/09_eksperyment_anthropic_za_20_000_dolarow_szesnascie_instancji_claude_opus_4_6_stworzylo_kompilator_c_w_dwa_tygodnie_1.jpg)
![Eksperyment Anthropic za 20 000 dolarów. Szesnaście instancji Claude Opus 4.6 stworzyło kompilator C w dwa tygodnie [2]](/image/news/2026/02/09_eksperyment_anthropic_za_20_000_dolarow_szesnascie_instancji_claude_opus_4_6_stworzylo_kompilator_c_w_dwa_tygodnie_0.jpg)





