Llama 2 - nowa generacja dużego modelu językowego od Mety, która powstała przy współpracy z Microsoftem
Kolejna odsłona dużego modelu językowego od Mety, jakim jest Llama 2, została właśnie za darmo udostępniona dla wszystkich - również do użytku komercyjnego. Mark Zuckerberg ogłosił na swoim profilu na Facebooku, że i tym razem współpracowano z firmą Microsoft. Cały kod Llama 2 jest otwartoźródłowy, z uwagi na niemal same zalety takiego rozwiązania. Model językowy charakteryzuje się sporo wyższym zakresem danych, na jakich został wytrenowany (niż Llama).
Meta zaprezentowała właśnie nowy duży model językowy o nazwie Llama 2. Kolejna generacja przynosi ze sobą sporo zmian, wśród których najważniejszą jest udostępnienie oprogramowania publicznie i za darmo (open source).
Meta prezentuje swój duży model językowy. Zuckerberg zdradził, jakiej spodziewać się wydajności względem ChatGPT
Na bazie dużego modelu językowego (LLM) Llama 2 udostępnione zostały trzy wersje, które różnią się od siebie parametrami (7, 13 lub 70 mld parametrów). Całość została wyszkolona przy użyciu zbioru, który był 40% większy niż przy pierwszej odsłonie. Dostępność dla wszystkich tego modelu ma się przyczynić do większego bezpieczeństwa oraz wglądu w jego funkcjonowanie. Do pobrania są także modele, które zostały dopracowane pod kątem prowadzenia bardziej naturalnej konwersacji z człowiekiem. Llama 2 w wielu różnych benchmarkach (MMLU, TriviAQ, GSM8K, HumanEval itd.) okazuje się dużo lepszym modelem od MPT oraz Falcona. Z kolei jego (jako modelu chatbota) sposób działania zawsze będzie się charakteryzował udzielaniem odpowiedzi z szacunkiem dla użytkownika i bezstronnością wypowiedzi. W grę wchodzi wiele zasad, które nie pozwolą, aby model łamał ogólnoprzyjęte normy.
Kosmos-1 - multimodalny duży model językowy od Microsoftu. Jest dużo bardziej zaawansowany od GPT-3
Wspomniane partnerstwo z Microsoftem nie jest natomiast żadną nowością, ponieważ Meta już od wielu lat tworzy różne projekty, które oparte są na nim oparte (ONNX, PyTorch, jak również oprogramowanie dla gogli VR). Dzięki temu użytkownicy platformy Microsoft Azure lub systemu Windows (lokalnie) mogą skorzystać z wprowadzonej nowości. Jeśli sami chcemy przetestować możliwości nowego modelu językowego, musimy się najpierw udać na tę stronę i poprosić o dostęp, który wiąże się jednocześnie z akceptacją regulaminu. Llama 2 obecny jest również na platformach Github oraz HuggingFace (bez pobierania możemy wypróbować funkcjonalność). Wszystkie szczegóły dotyczące omawianego LLM zawiera ten obszerny dokument.
Powiązane publikacje

ARM ma już 40 lat. Architektura, która zasila smartfony, serwery i roboty, trafiła do ponad 250 miliardów urządzeń
22
Anthropic chce zajrzeć do wnętrza AI. Czy do 2027 roku odkryjemy, jak naprawdę myślą modele językowe?
22
Firma Elona Muska xAI chce pozyskać 25 miliardów dolarów na budowę superkomputera Colossus 2 z milionem GPU NVIDIA
60
Nowatorski interfejs mózg-komputer od Georgia Tech może zmienić sposób, w jaki ludzie komunikują się z technologią i otoczeniem
4