multimodalny
Gemini 2.0 - debiut nowej rodziny modeli AI od Google. Lepsze możliwości multimodalne i funkcja Deep Research

Google zaprezentowało właśnie nową rodzinę modeli AI, która ostatecznie ma wprowadzić nowe możliwości. Ma, ponieważ na ten moment publicznie dostępny jest tylko jeden wariant, który nie zapewnia dostępu do wszystkich funkcji. Gemini 2.0 zaoferuje zwiększone natywne możliwości multimodalne, a przy tym seria umożliwi nam posługiwanie się agentami AI. Możemy liczyć na lepszą wydajność oraz niższe opóźnienia niż do tej pory.
Ferret - Apple ukradkiem udostępniło swój duży model językowy i to za darmo. Firma oficjalnie dołącza do wyścigu AI

Praktycznie każde duże przedsiębiorstwo zaprezentowało już swój duży model językowy. W tej kwestii tylko Apple wydawało się pozostawać nieco w tyle. Okazuje się, że i ta firma opracowała już swój produkt, natomiast premiera odbyła się "po cichu". Multimodalny duży model językowy (MLLM) o nazwie Ferret (ang. fretka) został udostępniony już w październiku 2023 roku i to, co ciekawe - na otwartoźródłowej licencji (co w przypadku Apple wydaje się nieprawdopodobne).
Gemini - Google prezentuje nowy, multimodalny model sztucznej inteligencji. Możliwościami wyprzedza ChatGPT

W wyścigu związanym ze sztuczną inteligencją nieoczekiwanie na prowadzenie zdaje się wysuwać Google. Wczoraj (6 grudnia 2023) firma zaprezentowała swój nowy, multimodalny model AI o nazwie Gemini. W przeciwieństwie do obecnego Google Barda, nowość potrafi interpretować zarówno tekst, dźwięki, obrazy, jak i wideo, a przy okazji nie ma problemu z generowaniem kodu. Według badań jest to pierwszy model, który osiąga lepsze wyniki w teście MMLU (Massive Multitask Language Understanding) od ludzi.
Kosmos-1 - multimodalny duży model językowy od Microsoftu. Jest dużo bardziej zaawansowany od GPT-3

Dział SI cały czas się rozwija wręcz w błyskawicznym tempie. Nie tak dawno słyszeliśmy o tym, jak Meta zaprezentowała swoje rozwiązanie, a już mamy do czynienia z następnym modelem językowym. Tym razem jednak Microsoft postanowił skupić się na tzw. multimodalnym modelu. W przeciwieństwie do GPT-3 i LLAMA, potrafi on analizować to, co znajduje się na zdjęciach oraz udzielać na ich podstawie odpowiedzi. Już we wstępnej fazie rozwoju potrafi zaskakiwać.
Test Cronos: The New Dawn PC. Jakość technik NVIDIA DLSS 4, AMD FSR 3.1 oraz Intel XeSS 2. Frame Generation i skalowanie wydajności
Procesor Intel Core i5-14600K BOX plus Battlefield 6 teraz w rewelacyjnie niskiej cenie. Za 649 zł niczego lepszego nie dostaniesz
Test wydajności Cronos: The New Dawn - Dead Space po polsku, czyli za komuny nie było lepiej! Świetna grafika i wysokie wymagania
Linux z rekordowym udziałem w Polsce i Europie. Alternatywa dla Windowsa nigdy nie była tak popularna
NVIDIA ogranicza produkcję kart graficznych GeForce RTX 5060 i RTX 5060 Ti 8 GB w obliczu rynkowej dominacji