Meta prezentuje swój duży model językowy. Zuckerberg zdradził, jakiej spodziewać się wydajności względem ChatGPT

Natan Faleńczyk | 25-02-2023 18:00 |

Nauka i technika

Meta prezentuje swój duży model językowy. Zuckerberg zdradził, jakiej spodziewać się wydajności względem ChatGPT Wyścig o dominację na rynku zaczęty przez OpenAI trwa. Kolejne firmy dołączają do niego, starając się wybić z tłumu i zająć odpowiednią pozycję. Tym razem do akcji wkroczyła Meta. Przedstawiła swoje cztery modele językowe, z których jeden uzyskuje lepsze wyniki, niż GPT-3. Wszystko to przy mniejszej liczbie parametrów oraz rozmiarze. Otwiera więc możliwości, aby w niedalekiej przyszłości być dostępnym na naszych urządzeniach przenośnych.

Meta prezentuje swój model językowy LLaMA-13B, który w testach jest dużo wydajniejszy od GPT-3. Jednak chodzi tu o jego pracę na jednym GPU.

O burzliwej osobowości chatbota Sydney Microsoft wiedział dużo wcześniej. Dlaczego więc wtedy nie zareagował?

Wczoraj (24.02.2023 r.) Meta zaprezentowała swój duży model językowy (LLM) nazwany LLaMA-13B, który oparty jest na algorytmach sztucznej inteligencji. Jednocześnie jest on częścią większej rodziny modeli językowych LLaMA (ang. Large Language Model Meta AI). Według doniesień firmy przy znacznie mniejszym rozmiarze ma on przewyższać swoją wydajnością ChatGPT. Dzięki temu asystent językowy ma być możliwy do uruchomienia lokalnie na urządzeniach mobilnych i komputerach. Jeśli zaś chodzi o pozostałą kolekcję tych modeli językowych, to posiadają one od 7 do 65 miliardów parametrów (dla porównania ChatGPT ma ich 175 mld, a ERNIE 260 mld). Mają to być cztery nowe modele różniące się od siebie możliwościami i zastosowaniem. Stanowić będą podstawę dla swoich następców. Wszystkie przeszkolone są na podstawie ogólnodostępnych publicznych zbiorów danych, takich jak Wikipedia czy Common Crawl.

Today we release LLaMA, 4 foundation models ranging from 7B to 65B parameters.
LLaMA-13B outperforms OPT and GPT-3 175B on most benchmarks. LLaMA-65B is competitive with Chinchilla 70B and PaLM 540B.
The weights for all models are open and available at https://t.co/q51f2oPZlE
1/n pic.twitter.com/DPyJFBfWEq
— Guillaume Lample (@GuillaumeLample) February 24, 2023

Synchron testuje już swoje rozwiązania na ludziach. Szykuje się przełom dla osób sparaliżowanych?

W testach wydajnościowych model LLaMA-13B okazał się lepszy od ChatGPT w pracy na pojedynczym GPU. Jest to dość ciekawe, bo posiada od niego dużo mniej parametrów. Odgrywają one jedną z najważniejszych ról, jeśli chodzi o możliwości modeli językowych. Jednak im więcej dany model ich posiada, tym bardziej wzrasta jego rozmiar. Tak więc informacja, że ten model językowy, jest w stanie osiągać podobne wyniki co jego (wydawać by się mogło) potężniejszy rywal, jest dość zaskakująca. Mielibyśmy do czynienia z wielkim wzrostem wydajności. "Myślę, że będziemy w stanie uruchamiać modele językowe, które będą posiadać część możliwości ChatGPT na naszych smartfonach i laptopach w ciągu roku, bądź dwóch lat" - wypowiedział się niezależny badacz AI Simon Willison. Jako że LLaMA-13B jest 10-krotnie mniejszy od GPT-3, może okazać się to prawdziwe. Na ten moment można pobrać okrojoną wersję modelu od Mety z GitHuba. Natomiast w przypadku chęci otrzymania pełnego kodu trzeba wypełnić odpowiedni formularz.

Źródło: Ars Technica

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Implant mózgowy BrainGate2 pozwala sparaliżowanym mówić i śpiewać. Technologia UC Davis działa błyskawicznie i dokładnie

Doktorant MIT opracował system AI do odrestaurowania obrazów. Jest 66 razy szybszy od tradycyjnych metod konserwatorskich

Firma Billa Gatesa TerraPower dostała 650 mln USD od NVIDII i innych na budowę komercyjnego reaktora chłodzonego sodem

TSMC zapowiada CoPoS i PLP. Znacząca ewolucja, która pozwoli uzyskać więcej miejsca dla chipów

PCI-SIG finalizuje specyfikację PCI Express 7.0. Interfejs przygotowany jest na potrzeby systemów AI i cloud computing

Liczba komentarzy: 70

Komentarze:

Załaduj komentarze

Meta prezentuje swój duży model językowy. Zuckerberg zdradził, jakiej spodziewać się wydajności względem ChatGPT

Meta prezentuje swój model językowy LLaMA-13B, który w testach jest dużo wydajniejszy od GPT-3. Jednak chodzi tu o jego pracę na jednym GPU.

O burzliwej osobowości chatbota Sydney Microsoft wiedział dużo wcześniej. Dlaczego więc wtedy nie zareagował?

Synchron testuje już swoje rozwiązania na ludziach. Szykuje się przełom dla osób sparaliżowanych?

Powiązane publikacje

Implant mózgowy BrainGate2 pozwala sparaliżowanym mówić i śpiewać. Technologia UC Davis działa błyskawicznie i dokładnie

Doktorant MIT opracował system AI do odrestaurowania obrazów. Jest 66 razy szybszy od tradycyjnych metod konserwatorskich

Firma Billa Gatesa TerraPower dostała 650 mln USD od NVIDII i innych na budowę komercyjnego reaktora chłodzonego sodem

TSMC zapowiada CoPoS i PLP. Znacząca ewolucja, która pozwoli uzyskać więcej miejsca dla chipów

PCI-SIG finalizuje specyfikację PCI Express 7.0. Interfejs przygotowany jest na potrzeby systemów AI i cloud computing

Komentarze:

Test karty graficznej KFA2 GeForce RTX 5080 1-Click OC - Efektowne podświetlenie ARGB i regulowana podpórka w komplecie

Recenzja Soundcore Boom 3i. Pływający głośnik Bluetooth z dobrym basem, oświetleniem RGB i niezłym akumulatorem

Test obudowy komputerowej Corsair Frame 4000D RS - Przewiewna modułowa konstrukcja z kilkoma fajnymi udogodnieniami

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

Test chłodzenia AiO MSI MAG CoreLiquid A13 360 - Niedrogi zestaw o dobrej wydajności z efektownym podświetleniem ARGB

Wielki powrót Linuksa w Polsce, a Windows 11 po raz pierwszy wyprzedza Windowsa 10. Zobacz nowe statystyki

ASML, Airbus i Mistral AI bezskutecznie proszą o wstrzymanie przepisów unijnych dotyczących sztucznej inteligencji

Chatboty Meta AI Studio otrzymają możliwość zapamiętywania historii rozmów i kontaktowania się z użytkownikami

CoMaps - darmowe mapy na Androida i iOS, które szanują prywatność użytkowników. Bez reklam i działają offline

The Fairphone (Gen. 6) jednym z najłatwiej naprawialnych smartfonów na świecie. Ile kosztują części zamienne?

Test wydajności DOOM: The Dark Ages - Path Tracing to piekielne wymagania sprzętowe. Porównanie wydajności i jakości grafiki

NVIDIA z totalną dominacją na rynku kart graficznych dla PC. Intel na tym rynku praktycznie nie istnieje

AMD Radeon RX 9070 XT - modele z pamięciami GDDR6 od Samsunga są trochę wolniejsze od tych z modułami od SK hynix

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

Karty graficzne AMD Radeon RX 9000 w cenach blisko MSRP. Sytuacja architektury RDNA 4 wygląda już dużo lepiej

O portalu PurePC

Najważniejsze

Znajdź PurePC na