OpenAI wkracza w erę agentów AI. Sztuczna inteligencja zrobi, o co prosisz... o ile jej zapłacisz. Operator już dostępny w USA

Natan Faleńczyk | 24-01-2025 10:30 |

Oprogramowanie

OpenAI wkracza w erę agentów AI. Sztuczna inteligencja zrobi, o co prosisz... o ile jej zapłacisz. Operator już dostępny w USA Rozwój sztucznej inteligencji dość mocno przyspieszył od momentu przedstawienia chatbota ChatGPT pod koniec 2022 roku. Od tego czasu na rynku pojawiło się mnóstwo alternatywnych rozwiązań, a także modele zdolne generować obrazy, muzykę, a nawet krótkie wideo. Firmy pracują obecnie nad wprowadzeniem agentów AI, czyli modeli, które będą w stanie wykonywać zadania w prawdziwym świecie. OpenAI właśnie zaprezentowało taką nowość pod nazwą Operator.

Operator to pierwszy agent AI od OpenAI, który może wykonywać akcje w prawdziwym świecie. W obecnej fazie ma jeszcze swoje ograniczenia, a przy tym dostęp do niego mają tylko subskrybenci ChatGPT Pro z USA.

Sztuczna inteligencja uczy się korzystać z komputera. Anthropic zwiększa możliwości modelu Claude 3.5 Sonnet

Przyszłościowa wizja powoli zaczyna się urzeczywistniać - sztuczna inteligencja będzie w stanie wykonywać działania, o które ją poprosimy. Oczywiście niesie to za sobą wiele zagrożeń - tym bardziej że do tej pory nie rozwiązano problemu halucynacji (w skrócie: podawanie fałszywych informacji jako prawdziwe). Operator od OpenAI opiera się na nowym modelu Computer-Using Agent (CUA). Został wytrenowany w taki sposób, żeby wchodzić w interakcje z graficznym interfejsem użytkownika (tzw. GUI), a więc przyciskami, menu, czy też polami tekstowymi. Po wydaniu mu polecenia, otworzy on wbudowaną przeglądarkę internetową i zacznie je wykonywać. Może się posługiwać wirtualną myszką i klawiaturą, więc praktycznie wszystkie możliwe akcje są dostępne.

ChatGPT staje się wyszukiwarką internetową. Darmowy rywal dla Google, który ma znacznie większe możliwości

W praktyce Operator wykonuje zrzut ekranu z przeglądarki internetowej, analizuje go i podejmuje określone działanie. Gdy już je wykona, robi następny zrzut ekranu i powtarza wspomniane czynności aż do zakończenia całego procesu. W każdym momencie można przejąć kontrolę i wtedy nowość od OpenAI nie będzie przechwytywać tego, co się dzieje na ekranie. Dodatkowo Operator poprosi użytkownika o przejęcie kontroli w momencie, gdy trzeba będzie wykonać konkretne akcje, takie jak podanie loginu i hasła, danych płatniczych, czy też przejście przez CAPTCHA. Przed zatwierdzeniem ważnych operacji użytkownik musi je też potwierdzić. Zarazem możemy dać mu do wykonania wiele poleceń (np. kupno określonych produktów z wybranego sklepu, rezerwacja stolika w restauracji, zamówienie konkretnej usługi itd.).

Operator w obecnej fazie ma oczywiście ograniczenia, a także może się mylić. OpenAI wdrożyło odpowiednie zabezpieczenia, aby użytkownik nie mógł nabyć przez to rozwiązanie nielegalnych towarów, czy też broni. Agent AI nie wykona też transakcji bankowych ani innych zadań, które są dość istotne (np. decyzja w sprawie aplikacji o pracę). Nie ma on także dostępu do stron hazardowych lub takich, na których występują plugawe treści. Ponadto ma być odporny na obejście tych zabezpieczeń. Na ten moment Operator dostępny jest tylko dla użytkowników w USA, którzy subskrybują plan ChatGPT Pro (200 dolarów miesięcznie). Z czasem ma zostać udostępniony dla planów Plus, Team i Enterprise, a ostatecznie zostanie zintegrowany z chatbotem ChatGPT. Niebawem pojawi się interfejs API dla modelu CUA, co pozwoli innym deweloperom na tworzenie własnych agentów AI. Więcej informacji o wspomnianym modelu znajdziemy pod tym adresem.

Źródło: OpenAI

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Migracja na Windows 11 zaczęła przyspieszać. Strategia Microsoftu zdaje się przynosić oczekiwane rezultaty

Ile klatek z DLSS FG, a ile bez? Klient Steam oferuje nowy monitor wydajności. Zmiany dotyczą też Linuksa i trybu Big Picture

Apple prowadzi negocjacje z OpenAI i Anthropic w sprawie integracji zaawansowanych LLM z asystentem Siri

F-Droid - sklep z aplikacjami na Androida, o którym mogłeś nie wiedzieć. Łatwy dostęp do bazy FOSS

WhatsApp, Messenger, a może Signal? Jaki komunikator sprawdzi się dla nas najlepiej? Sprawdź zestawienie różnych rozwiązań

Liczba komentarzy: 42

Komentarze:

Załaduj komentarze

OpenAI wkracza w erę agentów AI. Sztuczna inteligencja zrobi, o co prosisz... o ile jej zapłacisz. Operator już dostępny w USA

Operator to pierwszy agent AI od OpenAI, który może wykonywać akcje w prawdziwym świecie. W obecnej fazie ma jeszcze swoje ograniczenia, a przy tym dostęp do niego mają tylko subskrybenci ChatGPT Pro z USA.

Sztuczna inteligencja uczy się korzystać z komputera. Anthropic zwiększa możliwości modelu Claude 3.5 Sonnet

ChatGPT staje się wyszukiwarką internetową. Darmowy rywal dla Google, który ma znacznie większe możliwości

Powiązane publikacje

Migracja na Windows 11 zaczęła przyspieszać. Strategia Microsoftu zdaje się przynosić oczekiwane rezultaty

Ile klatek z DLSS FG, a ile bez? Klient Steam oferuje nowy monitor wydajności. Zmiany dotyczą też Linuksa i trybu Big Picture

Apple prowadzi negocjacje z OpenAI i Anthropic w sprawie integracji zaawansowanych LLM z asystentem Siri

F-Droid - sklep z aplikacjami na Androida, o którym mogłeś nie wiedzieć. Łatwy dostęp do bazy FOSS

WhatsApp, Messenger, a może Signal? Jaki komunikator sprawdzi się dla nas najlepiej? Sprawdź zestawienie różnych rozwiązań

Komentarze:

Test obudowy komputerowej Corsair Frame 4000D RS - Przewiewna modułowa konstrukcja z kilkoma fajnymi udogodnieniami

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

Test chłodzenia AiO MSI MAG CoreLiquid A13 360 - Niedrogi zestaw o dobrej wydajności z efektownym podświetleniem ARGB

Test płyty głównej ASUS ROG Crosshair X870E Extreme - Kosmiczne wyposażenie w ekstremalnie wysokiej cenie

Test obudowy komputerowej MSI MPG Velox 300R Airflow PZ - Solidna konstrukcja plus wydajne 160 mm wentylatory ARGB

Francuski sąd skazał trzech byłych szefów Ubisoft za molestowanie i mobbing w miejscu pracy

SkyShowtime – filmowe i serialowe nowości VOD na lipiec 2025. Wśród premier Wicked, W garniturach, Sonic 3 oraz Poker Face

Stany Zjednoczone znoszą restrykcje eksportowe na oprogramowanie EDA dla Chin po miesięcznym okresie ograniczeń

G.SKILL CAMM2 DDR5 osiąga stabilne 10000 MT/s na płycie ASUS ROG Maximus Z890 Hero z procesorem Intel Core Ultra 7 265K

Lisa Su, CEO AMD, otrzyma w nagrodę akcje o wartości 33 mln dolarów za sukcesy w rozwoju technologii AI

Test wydajności DOOM: The Dark Ages - Path Tracing to piekielne wymagania sprzętowe. Porównanie wydajności i jakości grafiki

Test kart graficznych AMD Radeon RX 9060 XT vs NVIDIA GeForce RTX 5060 Ti - Waga kogucia doładowana 16 GB pamięci?

NVIDIA z totalną dominacją na rynku kart graficznych dla PC. Intel na tym rynku praktycznie nie istnieje

AMD Radeon RX 9070 XT - modele z pamięciami GDDR6 od Samsunga są trochę wolniejsze od tych z modułami od SK hynix

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

O portalu PurePC

Najważniejsze

Znajdź PurePC na