Naukowcy z Facebooka przetestowali "inteligencję" sztucznej inteligencji i odkryli, że jest ona niestety... dość głupia
Zespół badaczy z firmy Meta opracował nowy punkt odniesienia do oceny możliwości asystentów AI, takich jak model językowy GPT-4 od OpenAI. Zespół, w skład którego wchodzi "ojciec chrzestny AI" i główny naukowiec Mety, Yann LeCun, wymyślił egzamin o nazwie GAIA, który składa się z 466 pytań, które są "koncepcyjnie proste dla ludzi, ale stanowią wyzwanie dla najbardziej zaawansowanych SI".
Zespół badaczy z firmy Meta opracował nowy punkt odniesienia do oceny możliwości asystentów AI, takich jak model językowy GPT-4 od OpenAI. Jak się okazało - nie jest on tak inteligentny, jak by się mogło wydawać.
ChatGPT - chatbot od OpenAI zyska dostęp do nowych osobowości, które każdy będzie mógł stworzyć. Szykują się spore zmiany
Wyniki mówią same za siebie: ludzcy respondenci byli w stanie poprawnie odpowiedzieć na 92 procent pytań, podczas gdy Chat GPT-4, nawet wyposażony w kilka ręcznie wybranych wtyczek, uzyskał marne 15 procent. Zgodnie z opublikowaną przez zespół tabelą wyników GAIA, nawet niedawno wydany GPT-4 Turbo firmy OpenAI uzyskał mniej niż dziesięć procent. Sądząc więc po obecnych standardach, obecne modele sztucznej inteligencji od OpenAI są... nadal dość głupie. Nie jest jednak jasne, jak radziły sobie konkurencyjne duże modele językowe, takie jak Llama 2 firmy Meta lub Bard firmy Google.
OpenAI może być blisko kolejnego przełomu w kwestii sztucznej inteligencji. Trwają prace nad modelem Q*
Warto jednak przypomnieć, że OpenAI pracuje nad systemem Q* (Q-Star), który ma możliwości niedostępne dotychczas użytkowanym modelom. System nie tylko uczy się, ale wykazuje też oznaki zrozumienia problemów matematycznych. Choć rozwiązywanie zadań matematycznych (gdzie jest tylko jedna prawidłowa odpowiedź) wydaje się analogiczną funkcją do tej, którą posiadają chociażby kalkulatory, to mechanizm działania jest tutaj całkowicie odmienny. Q* bowiem na bieżąco uczy się i wykazuje oznaki zrozumienia określonych problemów. To oznacza znacznie większe możliwości niż te, które posiadają obecnie wykorzystywane modele.
Powiązane publikacje

Ceny nowoczesnych wafli krzemowych znacząco wzrosły na przestrzeni ostatnich 10 lat, ale postęp technologiczny jest szybszy
26
TSMC rozpoczęło produkcję w procesie technologicznym 2 nm. Na razie jej skala jest bardzo ograniczona
33
Duży model językowy został z powodzeniem uruchomiony na systemie Windows 98 i wiekowym komputerze
76
Wiosna na Marsie obfituje w niesamowite zjawiska. NASA zdradza, że koniec zimy jest pełen wybuchów, lawin oraz silnych wiatrów
41