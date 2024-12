Generatory obrazów takie jak Midjourney, Stable Diffusion, czy też DALL-E 3 muszą się teraz mierzyć z kolejnym graczem, jakim jest model Emu od Mety. Dzięki niemu, a tak naprawdę usłudze "Imagine With Meta AI", możemy już tworzyć dowolne grafiki za pomocą opisów tekstowych. Do tej pory funkcjonalność była częściowo dostępna w aplikacji Messenger dla określonej grupy użytkowników. Teraz udostępniono aplikację internetową. Efekty są naprawdę bardzo dobre.

Meta udostępniła swój generator obrazów dla szerszego grona odbiorców. Usługa jest oparta na modelu Emu, jednak żeby z niej skorzystać, musimy dokonać kilku dodatkowych kroków. Generowane obrazy są bardzo dobrej jakości i z pewnością jest to realna konkurencja dla DALL-E 3 i Midjourney.

Model Emu, który jest zdolny do generowania grafik z opisów tekstowych, został wyszkolony na podstawie 1,1 mld obrazów wraz z opisami do nich. Meta nie ukrywa, że za dane treningowe posłużyły publiczne materiały z Instagrama i Facebooka. Jeśli więc udostępnialiśmy tam swoje zdjęcia, to możliwe, że przysłużyliśmy się nieświadomie do rozwoju usługi. Na ten moment wprowadzona jest ona tylko na rynek Stanów Zjednoczonych i wymaga korzystania ze swojego konta Mety. Natomiast bez problemu możemy skorzystać z jakiejkolwiek usługi oferującej zmianę naszej prawdziwej lokalizacji (ze swojej strony mogę polecić darmowy TunnelBear VPN, gdzie mamy wszystkie lokalizacje do wyboru i 2 GB darmowego transferu). Kiedy już nasz adres IP wskazuje, że znajdujemy się w USA, możemy przejść na tę oficjalną stronę usługi i zalogować się na swoje konto.

To, co od razu zwraca uwagę, to szybkość, z jaką generowane są obrazy. Z pewnością jest to jedna z najlepszych usług w tym aspekcie. Utworzone obrazy są również bardzo dobrej jakości i zwyczajnie przyjemne dla oka. Widać, że Meta odpowiednio dostosowała model Emu, aby tworzył jak najlepiej wyglądające materiały. Po wpisaniu komendy (promptu) utworzone zostają cztery grafiki, z których każda ma rozdzielczość 1280 x 1280 px. Z pewnością na plus można zaliczyć generowanie rąk, które mają odpowiednią liczbę palców (w większości przypadków, ponieważ zdarzają się odstępstwa od tej reguły), czy też całkiem dokładne wykonywanie poleceń (choć nie w takim stopniu, jak w przypadku DALL-E 3). Model Emu już teraz jest całkiem poważną konkurencją, natomiast nie ma jeszcze tak dużych możliwości, jak rywale - dla przykładu generowanie tekstu leży jeszcze poza jego zasięgiem. Warto samemu się o wszystkim przekonać i przetestować nową usługę.

Źródło: Meta