Naukowcy z Facebooka przetestowali "inteligencję" sztucznej inteligencji i odkryli, że jest ona niestety... dość głupia
Zespół badaczy z firmy Meta opracował nowy punkt odniesienia do oceny możliwości asystentów AI, takich jak model językowy GPT-4 od OpenAI. Zespół, w skład którego wchodzi "ojciec chrzestny AI" i główny naukowiec Mety, Yann LeCun, wymyślił egzamin o nazwie GAIA, który składa się z 466 pytań, które są "koncepcyjnie proste dla ludzi, ale stanowią wyzwanie dla najbardziej zaawansowanych SI".
Zespół badaczy z firmy Meta opracował nowy punkt odniesienia do oceny możliwości asystentów AI, takich jak model językowy GPT-4 od OpenAI. Jak się okazało - nie jest on tak inteligentny, jak by się mogło wydawać.
ChatGPT - chatbot od OpenAI zyska dostęp do nowych osobowości, które każdy będzie mógł stworzyć. Szykują się spore zmiany
Wyniki mówią same za siebie: ludzcy respondenci byli w stanie poprawnie odpowiedzieć na 92 procent pytań, podczas gdy Chat GPT-4, nawet wyposażony w kilka ręcznie wybranych wtyczek, uzyskał marne 15 procent. Zgodnie z opublikowaną przez zespół tabelą wyników GAIA, nawet niedawno wydany GPT-4 Turbo firmy OpenAI uzyskał mniej niż dziesięć procent. Sądząc więc po obecnych standardach, obecne modele sztucznej inteligencji od OpenAI są... nadal dość głupie. Nie jest jednak jasne, jak radziły sobie konkurencyjne duże modele językowe, takie jak Llama 2 firmy Meta lub Bard firmy Google.
OpenAI może być blisko kolejnego przełomu w kwestii sztucznej inteligencji. Trwają prace nad modelem Q*
Warto jednak przypomnieć, że OpenAI pracuje nad systemem Q* (Q-Star), który ma możliwości niedostępne dotychczas użytkowanym modelom. System nie tylko uczy się, ale wykazuje też oznaki zrozumienia problemów matematycznych. Choć rozwiązywanie zadań matematycznych (gdzie jest tylko jedna prawidłowa odpowiedź) wydaje się analogiczną funkcją do tej, którą posiadają chociażby kalkulatory, to mechanizm działania jest tutaj całkowicie odmienny. Q* bowiem na bieżąco uczy się i wykazuje oznaki zrozumienia określonych problemów. To oznacza znacznie większe możliwości niż te, które posiadają obecnie wykorzystywane modele.
Powiązane publikacje
![Vayu One - robot dostawczy, który już zastępuje kurierów. Jest w pełni autonomiczny i tańszy w produkcji od konkurencji](/files/Image/m165/44292.png)
Vayu One - robot dostawczy, który już zastępuje kurierów. Jest w pełni autonomiczny i tańszy w produkcji od konkurencji
31![Elon Musk uruchomił jeden z najpotężniejszych klastrów serwerowych. Składa się z dziesiątek tysięcy układów NVIDIA H100](/files/Image/m165/44274.png)
Elon Musk uruchomił jeden z najpotężniejszych klastrów serwerowych. Składa się z dziesiątek tysięcy układów NVIDIA H100
37![Prezes SK Group podchodzi do AI z pewną dozą ostrożności. Porównuje obecne trendy do gorączki złota](/files/Image/m165/44261.jpg)
Prezes SK Group podchodzi do AI z pewną dozą ostrożności. Porównuje obecne trendy do gorączki złota
10![Intel prezentuje prototyp optycznego, zintegrowanego chipletu I/O dla centrów obliczeniowych i serwerów AI](/files/Image/m165/44041.jpg)
Intel prezentuje prototyp optycznego, zintegrowanego chipletu I/O dla centrów obliczeniowych i serwerów AI
16![Huawei inwestuje w centrum, które zajmie się opracowaniem zaawansowanych narzędzi do produkcji chipów](/files/Image/m165/44016.png)