Anthropic Claude 4.5 Sonnet z funkcją Focus. Nowy model AI może pracować nad zadaniami do 30 godzin bez przerwy
Firmy, takie jak OpenAI, Google i Anthropic, regularnie prezentują nowe wersje swoich modeli językowych, wprowadzając coraz bardziej zaawansowane funkcje. Nie chodzi już tylko o generowanie tekstu czy odpowiadanie na pytania. Najnowsze rozwiązania mają być inteligentnymi asystentami zdolnymi do wykonywania złożonych, wieloetapowych zadań. Firma Anthropic zaprezentowała właśnie model, który wprowadza w tej dziedzinie zupełnie nową jakość.
Praktycznie rzecz biorąc, obserwowaliśmy, jak model utrzymuje skupienie przez ponad 30 h podczas złożonych, wieloetapowych zadań - Anthropic.
Kontrowersyjne zasady użytkowania Anthropic. Administracja USA krytykuje restrykcje AI w operacjach służb bezpieczeństwa
Firma Anthropic oficjalnie zaprezentowała Claude Sonnet 4.5, model AI, który firma nazywa najlepszym na świecie narzędziem do programowania. Nowa wersja wyróżnia się nie tylko imponującymi wynikami w testach porównawczych, ale przede wszystkim zdolnością do utrzymania koncentracji podczas długotrwałych zadań wieloetapowych przez ponad 30 godzin bez utraty spójności działania.
Gigantyczna ugoda Anthropic odrzucona przez sędziego. 1,5 mld USD może nie wystarczyć autorom książek wykorzystanych przez AI
Model Claude Sonnet 4.5 ustanowił nowe rekordy w najważniejszych benchmarkach dla programistów. W teście SWE-bench Verified, który mierzy zdolności modeli AI do rozwiązywania rzeczywistych problemów z projektów GitHub, osiągnął wynik 77,2 proc. To znaczący skok w porównaniu do poprzednich modeli. Dla porównania, wcześniejsze wersje Claude osiągały około 42 proc. w podobnych testach. W OSWorld, oceniającym zdolność AI do wykonywania zadań komputerowych, Sonnet 4.5 uzyskał 61,4 proc., znacznie przewyższając wyniki konkurencji.
Pentagon przyznaje umowy po 200 milionów dolarów firmom xAI, Google, OpenAI i Anthropic na rozwój systemów AI dla wojska
Anthropic wprowadza także Claude Agent SDK, zestaw narzędzi programistycznych, który umożliwia tworzenie zaawansowanych agentów AI. To ta sama infrastruktura, która napędza Claude Code, wewnętrzne narzędzie firmy do autonomicznego programowania. SDK oferuje funkcje zarządzania pamięcią długoterminową, systemy uprawnień balansujące autonomię z kontrolą użytkownika, jak również koordynację podagentów pracujących nad wspólnym celem. Cena modelu pozostaje niezmieniona i wynosi 3 dolary za milion tokenów wejściowych i 15 dolarów za milion tokenów wyjściowych.
Apple prowadzi negocjacje z OpenAI i Anthropic w sprawie integracji zaawansowanych LLM z asystentem Siri
Znaczące ulepszenia dotyczą także bezpieczeństwa i zgodności z oczekiwaniami użytkowników. Claude Sonnet 4.5 został wydany zgodnie z protokołami AI Safety Level 3, które obejmują filtry wykrywające potencjalnie niebezpieczne treści, szczególnie związane z bronią chemiczną, biologiczną, radiologiczną i nuklearną. Model wykazuje zredukowane tendencje do sykofantyzmu, oszukiwania, dążenia do władzy, a także zachęcania do myślenia złudnego.
Powiązane publikacje

Microsoft wprowadza przeprojektowane menu Start w systemie Windows 11. Mniej klikania i więcej personalizacji
62
Gracz zbudował w Minecraft funkcjonalny model GPT z 5 milionami parametrów używając redstone, który odpowiada na pytania
15
Koniec z drogimi studiami mocap. Runway Act-Two animuje dowolną postać jednym nagraniem. Wystarczy kamerka telefonu
19
DirectX 12 Agility SDK 1.618 i Work Graphs wchodzą do gry. Microsoft dostarcza narzędzia przeciw stutteringowi
45