Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
.
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

Llama 2 - nowa generacja dużego modelu językowego od Mety, która powstała przy współpracy z Microsoftem

Natan Faleńczyk | 19-07-2023 12:30 |

Llama 2 - nowa generacja dużego modelu językowego od Mety, która powstała przy współpracy z MicrosoftemKolejna odsłona dużego modelu językowego od Mety, jakim jest Llama 2, została właśnie za darmo udostępniona dla wszystkich - również do użytku komercyjnego. Mark Zuckerberg ogłosił na swoim profilu na Facebooku, że i tym razem współpracowano z firmą Microsoft. Cały kod Llama 2 jest otwartoźródłowy, z uwagi na niemal same zalety takiego rozwiązania. Model językowy charakteryzuje się sporo wyższym zakresem danych, na jakich został wytrenowany (niż Llama).

Meta zaprezentowała właśnie nowy duży model językowy o nazwie Llama 2. Kolejna generacja przynosi ze sobą sporo zmian, wśród których najważniejszą jest udostępnienie oprogramowania publicznie i za darmo (open source). 

Llama 2 - nowa generacja dużego modelu językowego od Mety, która powstała przy współpracy z Microsoftem [1]

Meta prezentuje swój duży model językowy. Zuckerberg zdradził, jakiej spodziewać się wydajności względem ChatGPT

Na bazie dużego modelu językowego (LLM) Llama 2 udostępnione zostały trzy wersje, które różnią się od siebie parametrami (7, 13 lub 70 mld parametrów). Całość została wyszkolona przy użyciu zbioru, który był 40% większy niż przy pierwszej odsłonie. Dostępność dla wszystkich tego modelu ma się przyczynić do większego bezpieczeństwa oraz wglądu w jego funkcjonowanie. Do pobrania są także modele, które zostały dopracowane pod kątem prowadzenia bardziej naturalnej konwersacji z człowiekiem. Llama 2 w wielu różnych benchmarkach (MMLU, TriviAQ, GSM8K, HumanEval itd.) okazuje się dużo lepszym modelem od MPT oraz Falcona. Z kolei jego  (jako modelu chatbota) sposób działania zawsze będzie się charakteryzował udzielaniem odpowiedzi z szacunkiem dla użytkownika i bezstronnością wypowiedzi. W grę wchodzi wiele zasad, które nie pozwolą, aby model łamał ogólnoprzyjęte normy. 

Llama 2 - nowa generacja dużego modelu językowego od Mety, która powstała przy współpracy z Microsoftem [2]

Kosmos-1 - multimodalny duży model językowy od Microsoftu. Jest dużo bardziej zaawansowany od GPT-3

Wspomniane partnerstwo z Microsoftem nie jest natomiast żadną nowością, ponieważ Meta już od wielu lat tworzy różne projekty, które oparte są na nim oparte (ONNX, PyTorch, jak również oprogramowanie dla gogli VR). Dzięki temu użytkownicy platformy Microsoft Azure lub systemu Windows (lokalnie) mogą skorzystać z wprowadzonej nowości. Jeśli sami chcemy przetestować możliwości nowego modelu językowego, musimy się najpierw udać na tę stronę i poprosić o dostęp, który wiąże się jednocześnie z akceptacją regulaminu. Llama 2 obecny jest również na platformach Github oraz HuggingFace (bez pobierania możemy wypróbować funkcjonalność). Wszystkie szczegóły dotyczące omawianego LLM zawiera ten obszerny dokument.

Llama 2 - nowa generacja dużego modelu językowego od Mety, która powstała przy współpracy z Microsoftem [3]

Źródło: Facebook @Mark Zuckerberg
Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Liczba komentarzy: 3

Komentarze:

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.