Nowy generator filmów 4K od Google może się okazać lepszy niż Sora od OpenAI. Firma udoskonaliła także model obrazu Imagen 3
Przedsiębiorstwo Google przedstawiło właśnie możliwości swoich zaktualizowanych modeli AI. Konkretniej mowa tu o generatorze materiałów wideo o nazwie Veo 2, a także ulepszonej wersji modelu obrazu Imagen 3. Ten pierwszy jest poważnym rywalem dla usługi Sora od OpenAI, gdyż skupia się na bardziej realistycznym oddaniu rzeczywistości. Imagen 3 z kolei zaoferuje nam sposobność tworzenia bardziej szczegółowych i jeszcze lepiej wyglądających obrazów.
Google rzuca rękawicę firmie OpenAI, która nie tak dawno udostępniła swój generator filmów o nazwie Sora. Konkurencyjna usługa ma się cechować bardziej realistycznymi rezultatami. Ulepszono też model obrazu Imagen 3.
Veo - nowy generator wideo korzystający z mocy AI od Google. Nadchodzi pierwszy poważny rywal dla Sory od OpenAI
Model obrazu Imagen 3 został udostępniony przez Google na początku 2024 roku. Ulepszona wersja ma zapewnić jeszcze lepiej wyglądające obrazy i z większą dokładnością będzie odwzorowywać wskazane przez nas style. Wygenerowane grafiki będą bogatsze w szczegóły, a przy tym sam model powinien się wierniej trzymać naszych poleceń, czyli tzw. promptów. Przykładowe obrazy pokazują, że faktycznie mamy do czynienia ze znaczącym udoskonaleniem. Z tej nowości skorzystamy poprzez usługę ImageFX w Google Labs (przez VPN-a).
Sora od OpenAI już dostępna. Generator wideo do dyspozycji każdego użytkownika - o ile opłaci subskrypcję
Ciekawiej zapowiada się z kolei generator filmów Veo 2. Google zaznacza, że w tym przypadku skupiono się na tym, aby "sztuczna inteligencja" lepiej rozumiała fizykę oraz ludzkie zachowania. Wyjściowe materiały mają się cechować większym realizmem, a zarazem świetną jakością. Generowane wideo może mieć rozdzielczość 4K, a maksymalna długość to jedna minuta. Firma twierdzi, że halucynacje będą dużo rzadziej spotykane (takie jak większa liczba palców w przypadku ludzkich dłoni). Będziemy w stanie również dokładnie określić styl i otrzymamy sporą kontrolę nad kamerą. Każdy stworzony w ten sposób materiał jest oznakowany cyfrowym znakiem wodnym SynthID (niewidoczny dla ludzi, ale dla komputerów już tak). Veo 2 jest dostępny na ten moment dla wybranych użytkowników, ale osoby z wielu krajów (choć nie z Polski) mogą się zapisać na listę oczekujących.
Powiązane publikacje

Koniec z przycięciami w grach. Inżynier Epic Games pokazuje, jak naprawić najbardziej irytujące problemy w Unreal Engine
61
AMD Variable Graphics Memory w Ryzen AI Max+ pozwala przydzielać pamięć RAM jako VRAM zaawansowanym modelom AI
31
OpenAI łączy modele GPT i o-series w jednym potężnym systemie GPT-5, który ma mieć debiut już w sierpniu
21
Blender trafi na tablety Apple iPad Pro. Program do grafiki 3D zawita też do modeli z Androidem na pokładzie
9