Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
.
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

mllm

Apple opracowało narzędzie AI, które pozwoli na łatwą obróbkę grafiki. Wystarczy opisać, co ma się w niej zmienić

Apple opracowało narzędzie AI, które pozwoli na łatwą obróbkę grafiki. Wystarczy opisać, co ma się w niej zmienić

Rozwój „sztucznej inteligencji” już teraz pozwala na tworzenie realistycznych obrazów, a także ich późniejszą modyfikację przy pomocy innych dostępnych narzędzi. Jednym z najnowszych jest całkiem ambitny projekt od Apple, które w ramach badań współpracowało razem z Uniwersytetem Kalifornijskim w Santa Barbara. Dzięki temu powstał MGIE (MLLM-Guided Image Editing), a więc rozwiązanie, które umożliwia obróbkę grafiki poprzez polecenia tekstowe.

Ferret - Apple ukradkiem udostępniło swój duży model językowy i to za darmo. Firma oficjalnie dołącza do wyścigu AI

Ferret - Apple ukradkiem udostępniło swój duży model językowy i to za darmo. Firma oficjalnie dołącza do wyścigu AI

Praktycznie każde duże przedsiębiorstwo zaprezentowało już swój duży model językowy. W tej kwestii tylko Apple wydawało się pozostawać nieco w tyle. Okazuje się, że i ta firma opracowała już swój produkt, natomiast premiera odbyła się "po cichu". Multimodalny duży model językowy (MLLM) o nazwie Ferret (ang. fretka) został udostępniony już w październiku 2023 roku i to, co ciekawe - na otwartoźródłowej licencji (co w przypadku Apple wydaje się nieprawdopodobne).

Kosmos-1 - multimodalny duży model językowy od Microsoftu. Jest dużo bardziej zaawansowany od GPT-3

Kosmos-1 - multimodalny duży model językowy od Microsoftu. Jest dużo bardziej zaawansowany od GPT-3

Dział SI cały czas się rozwija wręcz w błyskawicznym tempie. Nie tak dawno słyszeliśmy o tym, jak Meta zaprezentowała swoje rozwiązanie, a już mamy do czynienia z następnym modelem językowym. Tym razem jednak Microsoft postanowił skupić się na tzw. multimodalnym modelu. W przeciwieństwie do GPT-3 i LLAMA, potrafi on analizować to, co znajduje się na zdjęciach oraz udzielać na ich podstawie odpowiedzi. Już we wstępnej fazie rozwoju potrafi zaskakiwać.

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.