Nowy generator filmów 4K od Google może się okazać lepszy niż Sora od OpenAI. Firma udoskonaliła także model obrazu Imagen 3
Przedsiębiorstwo Google przedstawiło właśnie możliwości swoich zaktualizowanych modeli AI. Konkretniej mowa tu o generatorze materiałów wideo o nazwie Veo 2, a także ulepszonej wersji modelu obrazu Imagen 3. Ten pierwszy jest poważnym rywalem dla usługi Sora od OpenAI, gdyż skupia się na bardziej realistycznym oddaniu rzeczywistości. Imagen 3 z kolei zaoferuje nam sposobność tworzenia bardziej szczegółowych i jeszcze lepiej wyglądających obrazów.
Google rzuca rękawicę firmie OpenAI, która nie tak dawno udostępniła swój generator filmów o nazwie Sora. Konkurencyjna usługa ma się cechować bardziej realistycznymi rezultatami. Ulepszono też model obrazu Imagen 3.
Veo - nowy generator wideo korzystający z mocy AI od Google. Nadchodzi pierwszy poważny rywal dla Sory od OpenAI
Model obrazu Imagen 3 został udostępniony przez Google na początku 2024 roku. Ulepszona wersja ma zapewnić jeszcze lepiej wyglądające obrazy i z większą dokładnością będzie odwzorowywać wskazane przez nas style. Wygenerowane grafiki będą bogatsze w szczegóły, a przy tym sam model powinien się wierniej trzymać naszych poleceń, czyli tzw. promptów. Przykładowe obrazy pokazują, że faktycznie mamy do czynienia ze znaczącym udoskonaleniem. Z tej nowości skorzystamy poprzez usługę ImageFX w Google Labs (przez VPN-a).
Sora od OpenAI już dostępna. Generator wideo do dyspozycji każdego użytkownika - o ile opłaci subskrypcję
Ciekawiej zapowiada się z kolei generator filmów Veo 2. Google zaznacza, że w tym przypadku skupiono się na tym, aby "sztuczna inteligencja" lepiej rozumiała fizykę oraz ludzkie zachowania. Wyjściowe materiały mają się cechować większym realizmem, a zarazem świetną jakością. Generowane wideo może mieć rozdzielczość 4K, a maksymalna długość to jedna minuta. Firma twierdzi, że halucynacje będą dużo rzadziej spotykane (takie jak większa liczba palców w przypadku ludzkich dłoni). Będziemy w stanie również dokładnie określić styl i otrzymamy sporą kontrolę nad kamerą. Każdy stworzony w ten sposób materiał jest oznakowany cyfrowym znakiem wodnym SynthID (niewidoczny dla ludzi, ale dla komputerów już tak). Veo 2 jest dostępny na ten moment dla wybranych użytkowników, ale osoby z wielu krajów (choć nie z Polski) mogą się zapisać na listę oczekujących.
Powiązane publikacje

Duolingo stawia na AI. Chodzi o automatyzację procesów, a także redukcję kontraktorów w edukacyjnej rewolucji
22
Microsoft Recall oraz Click to Do trafiły do zapoznawczej aktualizacji Windowsa 11 dla komputerów Copilot+ AI
17
Dystrybucja OpenMandriva Lx 6.0 Rock już dostępna. Stabilna odsłona z KDE Plasma 6, która oferuje jądro Linux 6.15
28
Windows 11 - kwietniowe aktualizacje systemu i zabezpieczeń powodują błędy BSOD, a także problemy z logowaniem
78