GPT-4, a więc kolejna generacja modelu językowego sztucznej inteligencji, zaprezentowany został w połowie marca tego roku. Jest to tak zwany duży model językowy (LLM - Large Language Model), w dodatku multimodalny, co oznacza, że oprócz tekstu może przyjmować także inne typy danych: obrazy, dźwięki, animacje czy filmy wideo. Jak się okazuje, całkiem nieźle spisuje się także jako gracz Minecrafta.

Badacz sztucznej inteligencji Linxi „Jim” Fan przy współpracy z NVIDIĄ od jakiegoś czasu pracował nad przyuczaniem modelu GPT-4 do grania w Minecrafta. Jak się okazuje, model ów jest w tej kwestii nadzwyczaj sprawny.

Jak donoszą zagraniczne media, badacz sztucznej inteligencji Linxi „Jim” Fan przy współpracy z NVIDIĄ od jakiegoś czasu pracował nad przyuczaniem modelu GPT-4 do grania w Minecrafta. Przyuczony w ten sposób model został ochrzczony jako Voyager (ang. podróżnik). Wszystko dlatego, że grając we wspomniany tytuł odkrywa ją, generując sobie samodzielne kolejne cele. W skrócie wygląda to mniej więcej tak, że model wiedząc, iż ma w ekwipunku wędkę, a także, że w pobliżu jest rzeka, robi z tych informacji użytek i wybiera się na połów. Ot cwaniak! ;)

Stworzenie bota, który zagrywa się (ze skutkiem) w Minecrafta było o tyle trudne, że gra nie ma jasnych celów. Świat jest wszak generowany losowo, wydarzenia nieprzewidywalne, a kolejne poczynania zależą wyłącznie od gracza. Mimo to Voyager ma radzić sobie w zaskakująco dobry sposób. Wszystko dlatego, że zaprogramowano go przede wszystkim na "odkrycie jak największej liczny różnorodnych rzeczy w możliwie najszybszym czasie". Oczywiście nie zabrakło też elementu samodzielnego uczenia się, co jest kluczowe w dalszej eksploracji świata.

Co prawda badacze nie podzielili się ze światem gameplay'em prowadzonym przez owo SI, jednak twierdzą, że jest ono w tej kwestii naprawdę imponujące. Ma m.in. budować narzędzia 15 razy szybciej niż pozostałe znane nam modele. Szybciej (o dwa razy) eksploruje też świat, zdobywa też więcej (o trzy razy) przedmiotów. Badacze twierdzą, że wyniki te można jeszcze zoptymalizować, jeśli system zacznie uwzględniać dodatkowo informacje wizualne z gry. Przyznają jednak także, że model nie jest bez skazy. Potrafi się np. zaciąć lub uznać, że wykonane zadanie jeszcze nie zostało wykonane. Bywa też, że generuje zadania awykonalne (np. zbudowanie przedmiotu takiego jak miedziany miecz, który w grze nie istnieje).

Źródło: Wired