Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

Eksperyment Anthropic za 20 000 dolarów. Szesnaście instancji Claude Opus 4.6 stworzyło kompilator C w dwa tygodnie

Maciej Lewczuk | 09-02-2026 13:30 |

Eksperyment Anthropic za 20 000 dolarów. Szesnaście instancji Claude Opus 4.6 stworzyło kompilator C w dwa tygodnieAnthropic zaprezentowało eksperyment, który na pierwszy rzut oka wygląda imponująco. Szesnaście instancji modelu Claude Opus 4.6 samodzielnie zbudowało kompilator języka C zdolny do kompilacji jądra systemu Linux. Dwa tygodnie pracy autonomicznych agentów AI za niespełna 20 tys. dolarów. To osiągnięcie, które na tle tradycyjnego rozwoju kompilatorów trwającego dekady może wydawać się rewolucyjne.

Szesnaście instancji Claude Opus 4.6 zbudowało funkcjonalny kompilator C w dwa tygodnie, ale projekt ujawnił zarówno potencjał, jak i wyraźne granice autonomicznego kodowania AI.

Eksperyment Anthropic za 20 000 dolarów. Szesnaście instancji Claude Opus 4.6 stworzyło kompilator C w dwa tygodnie [1]

Claude kontra ChatGPT. Anthropic oficjalnie rezygnuje z modelu reklamowego w chatbotach AI

Nicholas Carlini, badacz z zespołu Safeguards w firmie Anthropic, wykorzystał nową funkcję Agent Teams dostępną w modelu Claude Opus 4.6. System uruchomił 16 niezależnych instancji AI, z których każda działała we własnym kontenerze Docker, miała dostęp do wspólnego repozytorium Git i bez centralnej koordynacji wybierała zadania do realizacji. Mechanizm był prosty. Agenty rezerwowały zadania, tworząc specjalne pliki, pisały kod w języku Rust i same naprawiały błędy przy łączeniu swoich prac. Gdy wszystko było gotowe, automatycznie wysyłały poprawki do głównego folderu projektu. W ciągu niemal 2000 sesji Claude Code, pochłaniając 2 mld tokenów wejściowych i generując 140 mln tokenów wyjściowych, system wytworzył kompilator zdolny do kompilacji Linuksa 6.9 na architekturach x86, ARM i RISC-V.

Xcode 26.3 wprowadza Model Context Protocol i natywną obsługę autonomicznych agentów AI Claude i OpenAI

Rezultat faktycznie jest funkcjonalny. Kompilator osiąga 99-procentowy wskaźnik zaliczenia testów GCC torture suite, kompiluje projekty takie jak PostgreSQL, SQLite, Redis czy FFmpeg, a nawet przechodzi ostateczny test każdego kompilatora C, czyli uruchamia grę Doom. Jednak lista ograniczeń szybko sprowadza ten sukces na ziemię. Wygenerowany kod jest wyraźnie wolniejszy od tego, który wypluwa GCC nawet z wyłączonymi optymalizacjami. Kompilator nie radzi sobie z 16-bitowym trybem x86 potrzebnym do bootowania Linuksa i musi w tym fragmencie wywoływać GCC. Nie ma własnego asemblera ani linkera. Nowe funkcje regularnie psuły istniejący kod, a Opus 4.6 nie był w stanie samodzielnie naprawić wszystkich problemów.

Siqi Chen stworzył wtyczkę dla Claude, która obchodzi detektory tekstów AI używając zasad Wikipedii

Carlini otwarcie przyznaje, że to niemal granica możliwości obecnego modelu, a projekt był celowo dobrany jako idealny dla AI. Specyfikacja języka C jest znana od dekad, istnieją gotowe zestawy testów, a można weryfikować wyniki względem sprawdzonego GCC. Większość rzeczywistych projektów nie ma żadnej z tych zalet. W kontekście wcześniejszych doświadczeń z narzędziami AI wspierającymi programowanie, od asystentów typu GitHub Copilot po modele Mistral Devstral 2, ten eksperyment pokazuje zarówno skalę postępu, jak i najważniejsze bariery. Jak zauważyliśmy przy okazji raportu JetBrains 2025, 85 proc. deweloperów regularnie używa AI do kodowania, ale sceptycyzm wobec jakości generowanego kodu rośnie. Carlini wprost przyznaje, że perspektywa programistów wdrażających kod, którego nigdy osobiście nie zweryfikowali, budzi niepokój. Autonomiczne systemy łatwo przechodzą testy, ale to rzadko oznacza, że praca jest naprawdę skończona. Najważniejszym pytaniem jest nie "czy kod działa", ale "czy wiemy, co ten kod faktycznie robi".

Eksperyment Anthropic za 20 000 dolarów. Szesnaście instancji Claude Opus 4.6 stworzyło kompilator C w dwa tygodnie [2]

Źródło: Anthropic, GitHub, Ars Technica
Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Liczba komentarzy: 40

Komentarze:

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.