Anthropic Claude 4.5 Sonnet z funkcją Focus. Nowy model AI może pracować nad zadaniami do 30 godzin bez przerwy

Maciej Lewczuk | 01-10-2025 13:30 |

Oprogramowanie

Anthropic Claude 4.5 Sonnet z funkcją Focus. Nowy model AI może pracować nad zadaniami do 30 godzin bez przerwy Firmy, takie jak OpenAI, Google i Anthropic, regularnie prezentują nowe wersje swoich modeli językowych, wprowadzając coraz bardziej zaawansowane funkcje. Nie chodzi już tylko o generowanie tekstu czy odpowiadanie na pytania. Najnowsze rozwiązania mają być inteligentnymi asystentami zdolnymi do wykonywania złożonych, wieloetapowych zadań. Firma Anthropic zaprezentowała właśnie model, który wprowadza w tej dziedzinie zupełnie nową jakość.

Praktycznie rzecz biorąc, obserwowaliśmy, jak model utrzymuje skupienie przez ponad 30 h podczas złożonych, wieloetapowych zadań - Anthropic.

Kontrowersyjne zasady użytkowania Anthropic. Administracja USA krytykuje restrykcje AI w operacjach służb bezpieczeństwa

Firma Anthropic oficjalnie zaprezentowała Claude Sonnet 4.5, model AI, który firma nazywa najlepszym na świecie narzędziem do programowania. Nowa wersja wyróżnia się nie tylko imponującymi wynikami w testach porównawczych, ale przede wszystkim zdolnością do utrzymania koncentracji podczas długotrwałych zadań wieloetapowych przez ponad 30 godzin bez utraty spójności działania.

Gigantyczna ugoda Anthropic odrzucona przez sędziego. 1,5 mld USD może nie wystarczyć autorom książek wykorzystanych przez AI

Model Claude Sonnet 4.5 ustanowił nowe rekordy w najważniejszych benchmarkach dla programistów. W teście SWE-bench Verified, który mierzy zdolności modeli AI do rozwiązywania rzeczywistych problemów z projektów GitHub, osiągnął wynik 77,2 proc. To znaczący skok w porównaniu do poprzednich modeli. Dla porównania, wcześniejsze wersje Claude osiągały około 42 proc. w podobnych testach. W OSWorld, oceniającym zdolność AI do wykonywania zadań komputerowych, Sonnet 4.5 uzyskał 61,4 proc., znacznie przewyższając wyniki konkurencji.

Pentagon przyznaje umowy po 200 milionów dolarów firmom xAI, Google, OpenAI i Anthropic na rozwój systemów AI dla wojska

Anthropic wprowadza także Claude Agent SDK, zestaw narzędzi programistycznych, który umożliwia tworzenie zaawansowanych agentów AI. To ta sama infrastruktura, która napędza Claude Code, wewnętrzne narzędzie firmy do autonomicznego programowania. SDK oferuje funkcje zarządzania pamięcią długoterminową, systemy uprawnień balansujące autonomię z kontrolą użytkownika, jak również koordynację podagentów pracujących nad wspólnym celem. Cena modelu pozostaje niezmieniona i wynosi 3 dolary za milion tokenów wejściowych i 15 dolarów za milion tokenów wyjściowych.

Apple prowadzi negocjacje z OpenAI i Anthropic w sprawie integracji zaawansowanych LLM z asystentem Siri

Znaczące ulepszenia dotyczą także bezpieczeństwa i zgodności z oczekiwaniami użytkowników. Claude Sonnet 4.5 został wydany zgodnie z protokołami AI Safety Level 3, które obejmują filtry wykrywające potencjalnie niebezpieczne treści, szczególnie związane z bronią chemiczną, biologiczną, radiologiczną i nuklearną. Model wykazuje zredukowane tendencje do sykofantyzmu, oszukiwania, dążenia do władzy, a także zachęcania do myślenia złudnego.

Źródło: Anthropic

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Deepfake nie ma szans? NVIDIA pokazuje narzędzie, które łapie fałszywe wideo z 92-procentową skutecznością w 22 milisekundy

Microsoft przywraca zablokowane 25-letnie konto Xboksa i OneDrive po publicznej krytyce w mediach społecznościowych

Linus Torvalds broni AI w jądrze Linuksa. Sashiko od Google wykrywa mnóstwo błędów, których wcześniej nie wyłapali ludzie

Microsoft blokuje konto po włamaniu i kasuje 25 lat danych użytkownika bez możliwości odzyskania

Obywatel Bielik. Miliony zdjęć z telefonów Polaków mają nauczyć AI, czym naprawdę są kluski śląskie

Liczba komentarzy: 3

Komentarze:

Załaduj komentarze

Anthropic Claude 4.5 Sonnet z funkcją Focus. Nowy model AI może pracować nad zadaniami do 30 godzin bez przerwy

Praktycznie rzecz biorąc, obserwowaliśmy, jak model utrzymuje skupienie przez ponad 30 h podczas złożonych, wieloetapowych zadań - Anthropic.

Kontrowersyjne zasady użytkowania Anthropic. Administracja USA krytykuje restrykcje AI w operacjach służb bezpieczeństwa

Gigantyczna ugoda Anthropic odrzucona przez sędziego. 1,5 mld USD może nie wystarczyć autorom książek wykorzystanych przez AI

Pentagon przyznaje umowy po 200 milionów dolarów firmom xAI, Google, OpenAI i Anthropic na rozwój systemów AI dla wojska

Apple prowadzi negocjacje z OpenAI i Anthropic w sprawie integracji zaawansowanych LLM z asystentem Siri

Powiązane publikacje

Deepfake nie ma szans? NVIDIA pokazuje narzędzie, które łapie fałszywe wideo z 92-procentową skutecznością w 22 milisekundy

Microsoft przywraca zablokowane 25-letnie konto Xboksa i OneDrive po publicznej krytyce w mediach społecznościowych

Linus Torvalds broni AI w jądrze Linuksa. Sashiko od Google wykrywa mnóstwo błędów, których wcześniej nie wyłapali ludzie

Microsoft blokuje konto po włamaniu i kasuje 25 lat danych użytkownika bez możliwości odzyskania

Obywatel Bielik. Miliony zdjęć z telefonów Polaków mają nauczyć AI, czym naprawdę są kluski śląskie

Komentarze:

Recenzja DDPAI Z90 Master 3CH. Wideorejestrator 4K + 4K + 3K, z doświetlaniem IR oraz podwójną pamięcią

Jaka myszka do grania? Jaka klawiatura mechaniczna? Poradnik zakupowy i polecany sprzęt dla graczy na lipiec 2026

Recenzja DDPAI Z60 Pro 3CH. Wideorejestrator 4K z trzema kamerami, w akceptowalnej cenie

Test wydajności Assassin's Creed Black Flag Resynced - Wymagania sprzętowe zmiatają z pokładu? Piraci puszczą wszystkich bez gaci?

Test procesora AMD Ryzen 7 7700X3D - Słabsza wersja AMD Ryzen 7 7800X3D... Jednak cena na poziomie szybszego modelu

Tomb Raider: Legacy of Atlantis - nowy gameplay prezentujący poruszanie się i eksplorację w grze

Deepfake nie ma szans? NVIDIA pokazuje narzędzie, które łapie fałszywe wideo z 92-procentową skutecznością w 22 milisekundy

Google szykuje Frozen v2. Chip pod Gemini ma dać 6–10x więcej tokenów z wata niż obecne TPU

Gracz przykręcił do GeForce RTX 4060 radiator wielkości cegły. Powstała z tego najszybsza pasywnie chłodzona karta graficzna

Steam Machine został wyceniony z myślą o przyszłych wzrostach cen pamięci RAM. Wywiad z inżynierami Valve ujawnia kulisy

Wyniki wielkiego konkursu na 20 urodziny PurePC! Sprawdź czy wygrałeś jedną z kilkudziesięciu nagród

Steam Machine z oficjalną ceną. Valve właśnie zgasiło entuzjazm graczy - aż trudno uwierzyć w te kwoty!

GeForce RTX 5090 Founders Edition padł w redakcyjnym teście. Kabel 12V-2x6 stopił się po obu stronach

Jest odczyt Hot Spot na NVIDIA GeForce RTX 5000 - Diagnostyczne programy zaczęły podawać informacje o temperaturach

Karty graficzne AMD Radeon RX 7000 z serii RDNA 3 od dzisiaj oficjalnie z dostępem do ulepszonego upscalingu FSR 4.1

O portalu PurePC

Najważniejsze

Znajdź PurePC na