Microsoft FARA-7B to kompaktowy model AI do autonomicznej obsługi komputera z wydajnością na poziomie GPT-4o
Cykl życia innowacji skraca się niemal z kwartału na kwartał, dlatego pojawienie się w pełni autonomicznych agentów AI jest momentem, który definiuje przyszłość interakcji człowiek-komputer. Przez lata słyszeliśmy o nich w kontekście filmów SF. Dziś, giganci tacy jak Microsoft wprowadzają je na rynek. Kompaktowy model ma potencjał, aby wywrócić do góry nogami nasze codzienne korzystanie z PC. Czy jesteśmy świadkami końca ery ręcznego klikania w interfejsach?
FARA-7B to kompaktowy model agentowy, który wykorzystuje widzenie komputerowe i LLM, aby osiągać wydajność agentów znacznie większych, skutecznie automatyzując skomplikowane zadania na komputerze.
Google Nano Banana Pro. Poznaj nowy model AI generujący obrazy w 4K z perfekcyjnym renderowaniem tekstu w wielu językach
Microsoft Research oficjalnie zaprezentował FARA-7B, pierwszy agentowy mały model językowy (SLM) zaprojektowany specjalnie do obsługi interfejsów komputerowych. W przeciwieństwie do tradycyjnych chatbotów generujących wyłącznie tekst, FARA-7B to Computer Use Agent (CUA), który operuje myszą i klawiaturą jak człowiek, wykonując zadania w imieniu użytkownika, od wypełniania formularzy przez wyszukiwanie informacji po rezerwację podróży. Podstawą jest bazowy model Qwen2.5-VL-7B firmy Alibaba, który Microsoft wytrenował na 145 000 trajektoriach obejmujących milion kroków interakcji z różnorodnymi stronami internetowymi. FARA-7B analizuje wyłącznie zrzuty ekranu przeglądarki, bez korzystania z drzew dostępności czy dodatkowych danych, przewidując konkretne akcje z precyzyjnymi współrzędnymi kliknięć. To jak nauczyć AI obserwowania ekranu dokładnie tak, jak robi to człowiek.
Nowy model Google Gemini 3 Pro przewyższa GPT-5.1 w benchmarkach rozumowania i generowania kodu front-end
Wyniki benchmarków są imponujące. W teście WebVoyager FARA-7B osiągnął 73,5 proc. skuteczności, przewyższając GPT-4o (65,1 proc.) i model OpenAI computer-use-preview (70,9 proc.). Co więcej, model Microsoftu jest znacznie efektywniejszy. Średnio potrzebuje zaledwie 16 kroków do wykonania zadania, podczas gdy konkurencyjny UI-TARS-1.5-7B wymaga 41 kroków. W nowo wprowadzonym benchmarku WebTailBench, skupiającym się na rzeczywistych scenariuszach jak rezerwacja biletów czy porównywanie cen, FARA-7B uzyskał wynik 38,4 proc., dystansując wszystkich rywali.
Sztuczna inteligencja Google AI Mode Shopping będzie kupować za Ciebie i dzwonić do sklepów. To nie science fiction, to już działa
Największą zaletą FARA-7B jest możliwość lokalnego uruchomienia na urządzeniu użytkownika. Dzięki kompaktowym rozmiarom model zmieści się w Copilot+ PC z systemem Windows 11, gdzie będzie działał z wykorzystaniem akceleracji NPU. To oznacza zmniejszone opóźnienia i podwyższoną prywatność, gdyż dane nigdy nie opuszczają komputera. Microsoft udostępnił model na licencji MIT zarówno w Microsoft Foundry, jak i na platformie Hugging Face, umożliwiając programistom eksperymentowanie z technologią.
Google Gemini zastąpi wewnętrzne modele Apple w asystencie AI Siri w systemie iOS 26.4
Dla użytkownika końcowego FARA-7B to potencjalna rewolucja w automatyzacji rutynowych zadań webowych. System potrafi samodzielnie wyszukiwać informacje, robić zakupy online czy zarządzać kontami, zatrzymując się w "punktach krytycznych", czyli sytuacjach wymagających danych osobowych lub zgody na nieodwracalne akcje. Microsoft zaleca uruchamianie modelu w środowisku piaskownicy z pełnym monitoringiem, co ogranicza ryzyko niezamierzonych działań. Warto jednak pamiętać, że FARA-7B to eksperymentalne wydanie. Model dzieli ograniczenia większych systemów. Może popełniać błędy w skomplikowanych zadaniach, nieprecyzyjnie realizować instrukcje czy generować nieprawdziwe informacje. Microsoft prowadził intensywne testy bezpieczeństwa, osiągając 82 proc. wskaźnik odmowy wykonania szkodliwych zadań w benchmarku WebTailBench-Refusals, ale technologia wciąż ewoluuje.
Co nowego w Windows 11? Nadchodzi bardziej funkcjonalny Notatnik, zmiana w Microsoft Store, tryb Xbox dla PC i inne
Patrząc szerzej, pojawienie się FARA-7B sygnalizuje istotny trend w branży AI, czyli przejście od gigantycznych modeli chmurowych do kompaktowych rozwiązań działających lokalnie. Podczas gdy Anthropic z modelem Claude Computer Use czy OpenAI z funkcją Operator stawiają na duże modele wymagające potężnych serwerów, Microsoft udowadnia, że efektywne agenty AI można uruchomić na zwykłym laptopie. To przypomina ewolucję, jaką przeszliśmy od mainframe'ów do komputerów osobistych, tylko tym razem chodzi o dostęp do inteligentnych agentów AI.
Powiązane publikacje

Microsoft rozdaje milion dolarów i Mercedesy za korzystanie z Edge. Jest jednak haczyk, którego reklama już nie eksponuje
28
Google Gemini połączył Nano Banana 2 z Google Photos. AI wygeneruje obrazy na podstawie prywatnej biblioteki użytkownika
16
Nowe AI przygotowane przez twórców Thunderbirda nie chce twoich danych w cudzej chmurze. Jest jednak ważny haczyk
4
Steam Proton 11 Beta ma zwiększyć stabilność gier na systemach Linux dzięki Wine 11. W drodze jest Proton dla chipów ARM
27







![Microsoft FARA-7B to kompaktowy model AI do autonomicznej obsługi komputera z wydajnością na poziomie GPT-4o [1]](/image/news/2025/11/26_microsoft_fara_7b_to_kompaktowy_model_ai_do_autonomicznej_obslugi_komputera_z_wydajnoscia_na_poziomie_gpt_4o_3.jpg)
![Microsoft FARA-7B to kompaktowy model AI do autonomicznej obsługi komputera z wydajnością na poziomie GPT-4o [2]](/image/news/2025/11/26_microsoft_fara_7b_to_kompaktowy_model_ai_do_autonomicznej_obslugi_komputera_z_wydajnoscia_na_poziomie_gpt_4o_0.jpg)
![Microsoft FARA-7B to kompaktowy model AI do autonomicznej obsługi komputera z wydajnością na poziomie GPT-4o [3]](/image/news/2025/11/26_microsoft_fara_7b_to_kompaktowy_model_ai_do_autonomicznej_obslugi_komputera_z_wydajnoscia_na_poziomie_gpt_4o_1.jpg)





