Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
.
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

multimodalny

Ferret - Apple ukradkiem udostępniło swój duży model językowy i to za darmo. Firma oficjalnie dołącza do wyścigu AI

Ferret - Apple ukradkiem udostępniło swój duży model językowy i to za darmo. Firma oficjalnie dołącza do wyścigu AI

Praktycznie każde duże przedsiębiorstwo zaprezentowało już swój duży model językowy. W tej kwestii tylko Apple wydawało się pozostawać nieco w tyle. Okazuje się, że i ta firma opracowała już swój produkt, natomiast premiera odbyła się "po cichu". Multimodalny duży model językowy (MLLM) o nazwie Ferret (ang. fretka) został udostępniony już w październiku 2023 roku i to, co ciekawe - na otwartoźródłowej licencji (co w przypadku Apple wydaje się nieprawdopodobne).

Gemini - Google prezentuje nowy, multimodalny model sztucznej inteligencji. Możliwościami wyprzedza ChatGPT

Gemini - Google prezentuje nowy, multimodalny model sztucznej inteligencji. Możliwościami wyprzedza ChatGPT

W wyścigu związanym ze sztuczną inteligencją nieoczekiwanie na prowadzenie zdaje się wysuwać Google. Wczoraj (6 grudnia 2023) firma zaprezentowała swój nowy, multimodalny model AI o nazwie Gemini. W przeciwieństwie do obecnego Google Barda, nowość potrafi interpretować zarówno tekst, dźwięki, obrazy, jak i wideo, a przy okazji nie ma problemu z generowaniem kodu. Według badań jest to pierwszy model, który osiąga lepsze wyniki w teście MMLU (Massive Multitask Language Understanding) od ludzi.

Kosmos-1 - multimodalny duży model językowy od Microsoftu. Jest dużo bardziej zaawansowany od GPT-3

Kosmos-1 - multimodalny duży model językowy od Microsoftu. Jest dużo bardziej zaawansowany od GPT-3

Dział SI cały czas się rozwija wręcz w błyskawicznym tempie. Nie tak dawno słyszeliśmy o tym, jak Meta zaprezentowała swoje rozwiązanie, a już mamy do czynienia z następnym modelem językowym. Tym razem jednak Microsoft postanowił skupić się na tzw. multimodalnym modelu. W przeciwieństwie do GPT-3 i LLAMA, potrafi on analizować to, co znajduje się na zdjęciach oraz udzielać na ich podstawie odpowiedzi. Już we wstępnej fazie rozwoju potrafi zaskakiwać.

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.