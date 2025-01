Dużych modeli językowych (LLM), a co za tym idzie także chatbotów, jest na rynku coraz więcej. Mimo że ich twórcy szczycą się możliwościami swoich produktów, to nie przedstawiają wyników, które byłyby interesujące dla typowego użytkownika. Istnieje jednak pewna platforma, która pozwala ocenić dany model w dużo ciekawszy sposób. Wynika z niej, że po raz pierwszy na tronie nie zasiada już LLM od OpenAI. Teraz króluje startup Anthropic z modelami z rodziny Claude 3.

Po raz pierwszy w rankingu Chatbot Arena model GPT-4 nie jest na szczycie. Jego koronę zabrał Claude 3 Opus, a więc jeden z LLM, które pojawiły się zaledwie miesiąc temu. Startup Anthropic wychodzi na spore prowadzenie.

Chatbot Arena jest bardzo interesującą platformą, która pozwala skonfrontować ze sobą losowe duże modele językowe. Użytkownik zadaje pytanie lub po prostu prowadzi konwersacje z dwoma LLM jednocześnie. Nie wie jednak, z jakimi konkretnie modelami ma do czynienia. W dowolnym momencie może wybrać, które z wygenerowanych odpowiedzi są lepsze. Rzecz jasna otrzymuje także możliwość określenia, że oba modele wypadły słabo lub wskazania remisu. Dopiero po tym zabiegu wiadomo, kto jest zwycięzcą pojedynku. Ten proces umożliwia tworzenie rankingu, który funkcjonuje już od początku maja 2023 roku. Od pojawienia się GPT-4 żaden inny model nie zdołał się wybić na pierwsze miejsce. Mamy więc do czynienia z małą rewolucją, która na dodatek odnosi się do rodziny modeli Claude 3 wprowadzonych w marcu 2024 roku.

Pierwsze miejsce zajmuje najbardziej zaawansowany model ze wspomnianej generacji, a więc Claude 3 Opus. Zaskakująco dobrze wypada również wariant Claude 3 Haiku, który jest najsłabszym LLM z nowej rodziny. W rankingu wyprzedza GPT-4 z czerwca 2023 roku (0613). Całkiem wysoko plasuje się także Gemini Pro, czyli wersja, która jest powszechnie dostępna poprzez chatbota Gemini (dawniej Bard). Wiele osób w obliczu zmian na rynku zdecydowało się zrezygnować z produktów od OpenAI i przejść do konkurencyjnych rozwiązań, które już teraz okazują się lepsze w wielu aspektach. Z różnych doniesień wynika, że organizacja, w której za sterami stoi Sam Altman, może wprowadzić na rynek kolejną generację dużych modeli językowych GPT w połowie 2024 roku.

