Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

Elon Musk twierdzi, że Grok-4 to najinteligentniejsza AI świata. Niezależne testy pokazują zupełnie inną prawdę o jej możliwościach

Maciej Lewczuk | 14-07-2025 14:00 |

Elon Musk twierdzi, że Grok-4 to najinteligentniejsza AI świata. Niezależne testy pokazują zupełnie inną prawdę o jej możliwościachNajnowszy model sztucznej inteligencji Grok-4 firmy xAI Elona Muska wzbudza sporo kontrowersji. Mimo że oficjalne benchmarki wskazują na przewagę nad konkurencją w wielu dziedzinach, niezależne testy ujawniają słabości tego systemu. Model, który ma kosztować nawet 300 dolarów miesięcznie bywa wyraźnie słabszy od konkurencji, w zależności od typu zadania. Czy faktycznie zasługuje on na miano najbardziej zaawansowanej AI na świecie?

Chatbot xAI Grok 4 pokazuje, że AI potrafi negocjować, ale pod presją łatwo traci przewagę. Nawet Gemini 2.5 Flash osiągnął lepsze wyniki od niego w dynamicznych wyzwaniach strategicznych.

Elon Musk twierdzi, że Grok-4 to najinteligentniejsza AI świata. Niezależne testy pokazują zupełnie inną prawdę o jej możliwościach [1]

Grok 4 debiutuje w cieniu skandalu. Czy nowy model xAI naprawdę przewyższa ChatGPT i Gemini w każdej dziedzinie?

Model Grok-4 firmy xAI osiąga obiecujące wyniki w testach sztucznej inteligencji. Podczas gdy oficjalne benchmarki pokazują jego dominację nad konkurencją, niezależne testy ujawniają poważne słabości w obszarach wymagających dynamicznej strategii i współpracy. Najnowszy produkt Elona Muska zajął jedynie piąte miejsce w Multi-Agent Step Race Benchmark, osiągając wynik 7,9 punktu TrueSkill, podczas gdy model o3 firmy OpenAI utrzymuje pierwszą pozycję z rezultatem 9,4 punktu. Test Multi-Agent Step Race Benchmark ocenia zdolność modeli AI do współpracy i strategicznego myślenia pod presją czasową, używając układanek z New York Times Connections. Wyniki sugerują, że Grok-4 może być zoptymalizowany pod kątem standardowych benchmarków akademickich, ale zawodzi w sytuacjach wymagających adaptacji i złożonego rozumowania w czasie rzeczywistym. To może oznaczać, że model nauczył się "na pamięć" danych treningowych zamiast rozwijać rzeczywiste zdolności analityczne.

Elon Musk twierdzi, że Grok-4 to najinteligentniejsza AI świata. Niezależne testy pokazują zupełnie inną prawdę o jej możliwościach [2]

Firma xAI reklamuje Grok-4 jako system osiągający wyniki na poziomie doktorskim we wszystkich dziedzinach akademickich. Model rzeczywiście imponuje w testach ARC-AGI-2, gdzie uzyskał 15,9 procent, czyli wynik znacznie przewyższający poprzednie osiągnięcia w tej kategorii. Jednak słabe rezultaty w testach strategicznych wskazują na ograniczenia w praktycznych zastosowaniach biznesowych i kreatywnych, gdzie wymagana jest elastyczność myślenia. Cennik nowych modeli budzi kontrowersje. Standardowy Grok-4 kosztuje 30 dolarów miesięcznie, podczas gdy wersja SuperGrok Heavy wymaga opłaty 300 dolarów miesięcznie. Jest to najdroższy model AI dostępny komercyjnie. Użytkownicy raportują jednak mieszane doświadczenia z systemem, szczególnie w kontekście niedawnych kontrowersji związanych z generowaniem nieodpowiednich treści przez poprzednie wersje chatbota.

Źródło: LechMazur (X), VraserX (X), WCCFTech
Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Liczba komentarzy: 8

Komentarze:

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.