multimodalny
Gemini 2.0 - debiut nowej rodziny modeli AI od Google. Lepsze możliwości multimodalne i funkcja Deep Research
Google zaprezentowało właśnie nową rodzinę modeli AI, która ostatecznie ma wprowadzić nowe możliwości. Ma, ponieważ na ten moment publicznie dostępny jest tylko jeden wariant, który nie zapewnia dostępu do wszystkich funkcji. Gemini 2.0 zaoferuje zwiększone natywne możliwości multimodalne, a przy tym seria umożliwi nam posługiwanie się agentami AI. Możemy liczyć na lepszą wydajność oraz niższe opóźnienia niż do tej pory.
Ferret - Apple ukradkiem udostępniło swój duży model językowy i to za darmo. Firma oficjalnie dołącza do wyścigu AI
Praktycznie każde duże przedsiębiorstwo zaprezentowało już swój duży model językowy. W tej kwestii tylko Apple wydawało się pozostawać nieco w tyle. Okazuje się, że i ta firma opracowała już swój produkt, natomiast premiera odbyła się "po cichu". Multimodalny duży model językowy (MLLM) o nazwie Ferret (ang. fretka) został udostępniony już w październiku 2023 roku i to, co ciekawe - na otwartoźródłowej licencji (co w przypadku Apple wydaje się nieprawdopodobne).
Gemini - Google prezentuje nowy, multimodalny model sztucznej inteligencji. Możliwościami wyprzedza ChatGPT
W wyścigu związanym ze sztuczną inteligencją nieoczekiwanie na prowadzenie zdaje się wysuwać Google. Wczoraj (6 grudnia 2023) firma zaprezentowała swój nowy, multimodalny model AI o nazwie Gemini. W przeciwieństwie do obecnego Google Barda, nowość potrafi interpretować zarówno tekst, dźwięki, obrazy, jak i wideo, a przy okazji nie ma problemu z generowaniem kodu. Według badań jest to pierwszy model, który osiąga lepsze wyniki w teście MMLU (Massive Multitask Language Understanding) od ludzi.
Kosmos-1 - multimodalny duży model językowy od Microsoftu. Jest dużo bardziej zaawansowany od GPT-3
Dział SI cały czas się rozwija wręcz w błyskawicznym tempie. Nie tak dawno słyszeliśmy o tym, jak Meta zaprezentowała swoje rozwiązanie, a już mamy do czynienia z następnym modelem językowym. Tym razem jednak Microsoft postanowił skupić się na tzw. multimodalnym modelu. W przeciwieństwie do GPT-3 i LLAMA, potrafi on analizować to, co znajduje się na zdjęciach oraz udzielać na ich podstawie odpowiedzi. Już we wstępnej fazie rozwoju potrafi zaskakiwać.




























NVIDIA GeForce RTX 5000 - statystyki cenowe kart graficznych Blackwell na kwiecień 2026. Jak wyglądają kwoty na tle MSRP?
Test procesorów AMD Ryzen 7 7800X3D vs Ryzen 7 9800X3D vs Ryzen 9850X3D - Czy warto dopłacać do szybszych modeli?
Test wydajności Pragmata z Path Tracing - Klęka nawet GeForce RTX 5090! Lepiej przygotujcie upscaling i generator klatek
Tak będą wyglądać testy kart graficznych od Tyrion83. Tylko uczciwe, obiektywne i realne scenariusze
ASUS ROG Equalizer to nowy przewód 12V-2x6. Producent obiecuje niższe temperatury i równy rozkład prądu