Lumiere - bardziej realistyczne generowanie filmów od Google. Firma prezentuje nowy model zamiany tekstu na wideo
Tydzień bez tematu sztucznej inteligencji to tydzień stracony. Ponownie więc zaglądamy do tego segmentu technologii, aby bliżej przyjrzeć się nowości od firmy Google. Tym razem został zaprezentowany model o nazwie Lumiere, którego zadaniem jest generowanie materiałów wideo z opisów tekstowych. Jego możliwości zdają się jednak przewyższać wszystkie obecne modele i można uznać, że jest to najbardziej zaawansowane rozwiązanie, jakie do tej pory przedstawiono.
Firma Google oficjalnie przedstawiła nowy model Lumiere, który może zarówno generować wideo z opisów tekstowych, jak i edytować już istniejące materiały. Wyróżnia go sposób działania, który jest inny od wszystkich obecnych rozwiązań.
Runway Gen-2 jest już dostępny dla każdego. Wszyscy mogą spróbować stworzyć wideo z opisu tekstowego
Podobnych rozwiązań widzieliśmy już kilka, a jednym z popularniejszych jest Runway Gen-2 (link powyżej). Natomiast najnowszy „produkt” od Google jest w stanie tworzyć dużo bardziej realistyczne i płynne materiały wideo. Wszystko przez sposób, w jaki to robi. Generowany jest bowiem od razu cały materiał, w którym uwzględniane jest wszystko, co ma się w nim docelowo znaleźć. Z kolei inne modele tworzą sekwencje pojedynczych klatek, które później stają się jedną całością, przez co końcowe wideo ma widoczny efekt „szarpania” (w dość dużym skrócie). Lumiere został wytrenowany na 30 mln filmów i jest w stanie generować 5-sekundowe materiały wideo w rozdzielczości 1024 x 1024 pikseli.
Meta wprowadza nowy generator obrazów. Prawdziwa konkurencja dla DALL-E 3 i Midjourney, która w dodatku jest darmowa
Lumiere potrafi jednak więcej niż tylko „klasycznie” wygenerować wideo z opisu tekstowego. Może również zanimować określony fragment ze zdjęcia, stworzyć wideo na podstawie stylu z dowolnej grafiki, czy też zmienić cokolwiek w istniejących filmach. Całość faktycznie wygląda całkiem dobrze, choć do ideału jeszcze sporo brakuje. Zachwyty nad technologią trzeba jednak odsunąć na bok, szczególnie że mamy do czynienia z firmą Google, która często lubi nieco „podkoloryzować” możliwości swoich tworów. Na ten moment nie można osobiście skorzystać z nowego rozwiązania. Nie wiadomo także, kiedy Lumiere trafi w ręce szerszej publiczności.
Powiązane publikacje

Duolingo stawia na AI. Chodzi o automatyzację procesów, a także redukcję kontraktorów w edukacyjnej rewolucji
22
Microsoft Recall oraz Click to Do trafiły do zapoznawczej aktualizacji Windowsa 11 dla komputerów Copilot+ AI
17
Dystrybucja OpenMandriva Lx 6.0 Rock już dostępna. Stabilna odsłona z KDE Plasma 6, która oferuje jądro Linux 6.15
28
Windows 11 - kwietniowe aktualizacje systemu i zabezpieczeń powodują błędy BSOD, a także problemy z logowaniem
78