Coroczna konferencja Google I/O 2024 jest już za nami. Firma zapowiedziała na niej całkiem sporo nowości, a tematem przewodnim całego wydarzenia była sztuczna inteligencja. Jednym z ciekawszych projektów okazał się Veo, czyli model AI zdolny generować materiały wideo z opisów tekstowych. Google miało co prawda już przynajmniej jedno podejście w tym segmencie (Lumiere), natomiast tym razem mamy mieć do czynienia z bardziej zaawansowanym rozwiązaniem.

Google oficjalnie zaprezentowało swój nowy generator wideo o nazwie Veo, który ma się stać bezpośrednią konkurencją dla modelu Sora od OpenAI. Już wkrótce pierwsze osoby będą mogły przetestować to rozwiązanie.

Minęły trzy miesiące od prezentacji wspomnianego modelu Sora — OpenAI pokazało, że rozwój technologii w ciągu roku potrafi być naprawdę imponujący. W tym czasie Google dysponowało jedynie mniej zaawansowanymi rozwiązaniami (po raz kolejny), więc aby dogonić rywali, firma musiała szybko opracować coś nowego. Mamy więc oficjalną zapowiedź modelu Veo, który może tworzyć wideo o "wysokiej jakości" w rozdzielczości Full HD. Długość generowanych materiałów wideo może przekraczać 60 sekund. Jesteśmy w stanie zarówno podać opis tekstowy, jak i użyć konkretnej grafiki jako przykładu. Google zapewnia, że ich model AI potrafi zrozumieć różne określenia używane w tej branży, takie jak timelapse, a przy okazji stworzy wideo w każdym stylu.

Wygenerowane wideo możemy także w pewien sposób edytować poprzez określenie tego, co ma się w nim zmienić. Dostępna będzie również "maska", którą będziemy w stanie oznaczyć konkretny obszar mający ulec wymaganej zmianie. Wybrane osoby, które zapiszą się do testów, będą mogły skorzystać z ograniczonej funkcjonalności Veo w ciągu kilku najbliższych tygodni, a w przyszłości rozwiązanie trafi nawet do segmentu YouTube Shorts. Pozostaje jedynie kwestia tego, czy Google uda się dogonić wciąż uciekającą konkurencję. OpenAI jeszcze w 2024 roku udostępni Sorę, a już teraz rozważa się integrację tego modelu z profesjonalnym oprogramowaniem, takim jak Adobe Premiere Pro. Ze wszystkimi wygenerowanymi materiałami przez nowość od Google zapoznamy się pod tym adresem.

Źródło: Google, The Verge