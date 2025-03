Powoli wkraczamy w nowy etap rozwoju sztucznej inteligencji, jakim są agenci AI. Wystarczy określić to, co mamy do zrobienia, a resztą zajmą się wirtualni asystenci, którzy są w stanie wykonywać działania w świecie rzeczywistym. Taka współpraca z pewnością może pomóc w automatyzacji wielu zadań. Firma Google zaprezentowała wczesne możliwości omawianych agentów AI, którzy są obecnie rozwijani dzięki rodzinie modeli AI Gemini 2.0 - mowa tu o projekcie Mariner.

Project Mariner to bardzo ambitne przedsięwzięcie, które wykorzystuje nowe możliwości rodziny Gemini 2.0 do tworzenia agentów AI. Pomogą nam oni w automatyzacji zadań, a już teraz wybrane osoby mogą skorzystać z nich w przeglądarce Google Chrome. Z czasem dostępność będzie większa.

Rodzina Gemini 2.0 została wprowadzona dosłownie przed chwilą, natomiast użytkownicy mogą skorzystać początkowo tylko z modelu Gemini 2.0 Flash Experimental (omówienie całej serii znajdziemy pod tym adresem). Nowość oferuje większe możliwości multimodalne, co przekłada się na sposobność tworzenia wspomnianych agentów AI. Project Mariner daje nam mały wgląd w to, co już można dzięki nim osiągnąć. Google postanowiło, że w tej prototypowej fazie agent AI będzie dostępny w przeglądarce internetowej Google Chrome (wraz z dedykowanym rozszerzeniem). Może on analizować informacje na otwartej karcie, takie jak „tekst, kod, obrazy, czy też formularze”, a także klikać elementy, przewijać stronę i wpisywać dane. Kiedy użytkownik określi jakieś zadanie, agent AI będzie więc w stanie dokonać określonych działań, żeby je wykonać (dzięki wspomnianemu rozszerzeniu).

Google otwarcie przyznaje, że jest to jeszcze bardzo wczesny etap, wszak agent AI wykonuje swoje zadania dość powoli, a przy tym nie zawsze jest dokładny. Przed wrażliwymi akcjami prosi o ich zatwierdzenie (np. w przypadku dokonywania zakupów). Może operować również tylko w aktywnym oknie przeglądarki internetowej. Z czasem sytuacja powinna się oczywiście poprawić. Oprócz tego Google tworzy agentów AI do pomocy w grach mobilnych, czy też takich, którzy potrafią analizować świat rzeczywisty i udzielać pomocnych informacji (Project Astra). W trakcie rozwoju są także agenci kodujący dla deweloperów (Jules). Być może rok 2025 będzie można nazwać początkiem dynamicznego rozwoju ery agentów AI.

Źródło: Google, Flaticon