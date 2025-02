Aktualny poziom usług opartych na sztucznej inteligencji pozwala osiągnąć naprawdę sporo w wielu dziedzinach. Sprawnie funkcjonujące duże modele językowe (LLM), czy też zaawansowane naśladowanie czyjegoś głosu, to dziś chleb powszedni. Najnowsze zdobycze technologii postanowili wypróbować pracownicy z firmy Boston Dynamics, którzy specjalizują się w dziedzinie robotyki. Ich urządzenia pokazywały już swoje możliwości w zakresie ruchu (jak choćby roboty, które potrafiły zrobić salto), natomiast teraz nauczyły się mówić.

Firma Boston Dynamics wykorzystała obecne możliwości dużych modeli językowych oraz tych, które potrafią interpretować rzeczywistość, aby sprawić, by roboty przemówiły ludzkim głosem. Na dodatek potrafią przywdziewać różne osobowości, a także są poniekąd samodzielne.

Cały eksperyment został wykonany w celu lepszego zobrazowania, do czego obecnie jest zdolna "sztuczna inteligencja", a dokładniej mówiąc - konkretne duże modele językowe (LLM), VQA oraz zamiana tekstu na mowę wraz z generowaniem świetnie brzmiących głosów. Połączenie tych elementów z robotem firmy Boston Dynamics (Spotem), pozwoliło osiągnąć naprawdę zaskakujące rezultaty. Utworzony został specjalny pakiet oprogramowania (SDK), aby umożliwić robotowi oprowadzanie zwiedzających po obiekcie. Wraz z nim zintegrowano usługę ChatGPT (GPT-4), żeby Spot mógł korzystać z wygenerowanych odpowiedzi. Dodatkowo połączenie modelu VQA, kamer i głośników, pozwoliło mu interpretować obiekty i je opisywać. Końcowym elementem okazała się technologia polskiego projektu ElevenLabs, dzięki czemu robot mógł przemawiać realistycznym głosem.

Pracownicy sami byli zdumieni, z jaką łatwością można nadać jakąkolwiek nową osobowość robotowi. Wystarczyła lekka zmiana w kodzie i Spot miał wygenerowany inny charakter, którym się niejako stawał. Całkiem dobrze sprawdzały się osobowości, które wyróżniały się lekkim sarkazmem. Ciekawą sytuacją było poproszenie robota o wskazanie swoich rodziców - wtedy też Spot udał się do modeli stworzonych przed nim (Spot V1 i Big Dog) i po wskazaniu ich powiedział, że to są jego "starsi" (ang. elders). Równie intrygujące było zapytanie go "kim jest Marc Raibert?" - odpowiedzią robota było "Nie mam pojęcia. Chodźmy do działu pomocy i zapytajmy", po czym udał się on do wspomnianego działu i zadał to pytanie. Mimo że wygląda to na wolną wolę i cząstkę świadomości, to niestety jest to tylko świetnie skompilowane oprogramowanie, które potrafi dobrze łączyć wątki. Warto samemu zobaczyć choćby fragmenty poniższego materiału. Obecna technologia potrafi zaskakiwać.

Źródło: Boston Dynamics