Naukowcy z Facebooka przetestowali "inteligencję" sztucznej inteligencji i odkryli, że jest ona niestety... dość głupia

Dominik Wiśniewski | 29-11-2023 22:00 |

Nauka i technika

Naukowcy z Facebooka przetestowali "inteligencję" sztucznej inteligencji i odkryli, że jest ona niestety... dość głupia Zespół badaczy z firmy Meta opracował nowy punkt odniesienia do oceny możliwości asystentów AI, takich jak model językowy GPT-4 od OpenAI. Zespół, w skład którego wchodzi "ojciec chrzestny AI" i główny naukowiec Mety, Yann LeCun, wymyślił egzamin o nazwie GAIA, który składa się z 466 pytań, które są "koncepcyjnie proste dla ludzi, ale stanowią wyzwanie dla najbardziej zaawansowanych SI".

Zespół badaczy z firmy Meta opracował nowy punkt odniesienia do oceny możliwości asystentów AI, takich jak model językowy GPT-4 od OpenAI. Jak się okazało - nie jest on tak inteligentny, jak by się mogło wydawać.

ChatGPT - chatbot od OpenAI zyska dostęp do nowych osobowości, które każdy będzie mógł stworzyć. Szykują się spore zmiany

Wyniki mówią same za siebie: ludzcy respondenci byli w stanie poprawnie odpowiedzieć na 92 procent pytań, podczas gdy Chat GPT-4, nawet wyposażony w kilka ręcznie wybranych wtyczek, uzyskał marne 15 procent. Zgodnie z opublikowaną przez zespół tabelą wyników GAIA, nawet niedawno wydany GPT-4 Turbo firmy OpenAI uzyskał mniej niż dziesięć procent. Sądząc więc po obecnych standardach, obecne modele sztucznej inteligencji od OpenAI są... nadal dość głupie. Nie jest jednak jasne, jak radziły sobie konkurencyjne duże modele językowe, takie jak Llama 2 firmy Meta lub Bard firmy Google.

OpenAI może być blisko kolejnego przełomu w kwestii sztucznej inteligencji. Trwają prace nad modelem Q*

Warto jednak przypomnieć, że OpenAI pracuje nad systemem Q* (Q-Star), który ma możliwości niedostępne dotychczas użytkowanym modelom. System nie tylko uczy się, ale wykazuje też oznaki zrozumienia problemów matematycznych. Choć rozwiązywanie zadań matematycznych (gdzie jest tylko jedna prawidłowa odpowiedź) wydaje się analogiczną funkcją do tej, którą posiadają chociażby kalkulatory, to mechanizm działania jest tutaj całkowicie odmienny. Q* bowiem na bieżąco uczy się i wykazuje oznaki zrozumienia określonych problemów. To oznacza znacznie większe możliwości niż te, które posiadają obecnie wykorzystywane modele.

Źródło: futurism

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Implant mózgowy BrainGate2 pozwala sparaliżowanym mówić i śpiewać. Technologia UC Davis działa błyskawicznie i dokładnie

Doktorant MIT opracował system AI do odrestaurowania obrazów. Jest 66 razy szybszy od tradycyjnych metod konserwatorskich

Firma Billa Gatesa TerraPower dostała 650 mln USD od NVIDII i innych na budowę komercyjnego reaktora chłodzonego sodem

TSMC zapowiada CoPoS i PLP. Znacząca ewolucja, która pozwoli uzyskać więcej miejsca dla chipów

PCI-SIG finalizuje specyfikację PCI Express 7.0. Interfejs przygotowany jest na potrzeby systemów AI i cloud computing

Liczba komentarzy: 24

Komentarze:

Załaduj komentarze

Naukowcy z Facebooka przetestowali "inteligencję" sztucznej inteligencji i odkryli, że jest ona niestety... dość głupia

Zespół badaczy z firmy Meta opracował nowy punkt odniesienia do oceny możliwości asystentów AI, takich jak model językowy GPT-4 od OpenAI. Jak się okazało - nie jest on tak inteligentny, jak by się mogło wydawać.

ChatGPT - chatbot od OpenAI zyska dostęp do nowych osobowości, które każdy będzie mógł stworzyć. Szykują się spore zmiany

OpenAI może być blisko kolejnego przełomu w kwestii sztucznej inteligencji. Trwają prace nad modelem Q*

Powiązane publikacje

Implant mózgowy BrainGate2 pozwala sparaliżowanym mówić i śpiewać. Technologia UC Davis działa błyskawicznie i dokładnie

Doktorant MIT opracował system AI do odrestaurowania obrazów. Jest 66 razy szybszy od tradycyjnych metod konserwatorskich

Firma Billa Gatesa TerraPower dostała 650 mln USD od NVIDII i innych na budowę komercyjnego reaktora chłodzonego sodem

TSMC zapowiada CoPoS i PLP. Znacząca ewolucja, która pozwoli uzyskać więcej miejsca dla chipów

PCI-SIG finalizuje specyfikację PCI Express 7.0. Interfejs przygotowany jest na potrzeby systemów AI i cloud computing

Komentarze:

Test obudowy komputerowej Corsair Frame 5000D RS - Większa i lepiej wyposażona wersja Corsair Frame 4000D RS

Test smartfona Nothing Phone (3) - wydajny i oryginalny, ale czy na pewno godny miana flagowca?

Test smartfona OnePlus Nord CE5 - na zewnątrz muzeum, w środku... liceum? Oto prawdziwy sleeper wśród smartfonów

Test smartfona vivo V50 - stylowy model z pojemną baterią. Zachwyci amatorów fotografii, ale rozczaruje maniaków wydajności

Test obudowy komputerowej FSP M580 - Jednolita szklana tafla i cztery wentylatory z efektem lustra w rozsądnej cenie

Anulowanie subskrypcji Netflix i Disney Plus pozostanie trudne po zwycięstwie w sądzie przeciwko amerykańskiemu regulatorowi

Ugoda Epic Games i Samsunga w sprawie funkcji Auto Blocker blokującej instalację Epic Games Store na smartfonach Galaxy

Google wdraża nowe narzędzie zarządzania subskrypcjami w Gmail, usprawniające obsługę newsletterów i promocji

Deepfake głosu Marco Rubio wykorzystany w cyberataku na ministrów spraw zagranicznych i gubernatorów poprzez Signala

Niższe ceny na karty graficzne GeForce RTX 5000, pamięci RAM, dyski SSD, zasilacze i sprzęt przydatny na wakacjach

Test wydajności DOOM: The Dark Ages - Path Tracing to piekielne wymagania sprzętowe. Porównanie wydajności i jakości grafiki

AMD Radeon RX 9070 XT - modele z pamięciami GDDR6 od Samsunga są trochę wolniejsze od tych z modułami od SK hynix

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

Karty graficzne AMD Radeon RX 9000 w cenach blisko MSRP. Sytuacja architektury RDNA 4 wygląda już dużo lepiej

NVIDIA GeForce RTX 5070 SUPER oraz GeForce RTX 5070 Ti SUPER - Nadchodzą lepiej wyposażone karty graficzne Blackwell

O portalu PurePC

Najważniejsze

Znajdź PurePC na