Google chce wprowadzić generowanie filmów na inny poziom. Technologia V2A stworzy do nich ścieżki dźwiękowe

Natan Faleńczyk | 19-06-2024 18:00 |

Oprogramowanie

Google chce wprowadzić generowanie filmów na inny poziom. Technologia V2A stworzy do nich ścieżki dźwiękowe Początkowo za dość rewolucyjne mogliśmy uznać generowanie wysokiej jakości obrazów z opisów tekstowych. Logicznym następstwem było tworzenie przez odpowiednie algorytmy materiałów wideo. W drugim przypadku istotną wadą jest brak ścieżki dźwiękowej, więc mamy do czynienia z niemymi filmami. Firma Google stara się to zmienić i właśnie zaprezentowała efekty technologii V2A (video-to-audio), które już teraz są naprawdę całkiem obiecujące.

Google podzieliło się rezultatami, jakie już teraz można osiągnąć przy pomocy technologii V2A. Dzięki niej nieme filmy mogą ożyć, ponieważ generowana jest do nich ścieżka dźwiękowa. Całość wypada naprawdę dobrze.

Veo - nowy generator wideo korzystający z mocy AI od Google. Nadchodzi pierwszy poważny rywal dla Sory od OpenAI

Nie da się ukryć, że Google za wszelką cenę stara się dogonić uciekającą konkurencję w dziedzinie sztucznej inteligencji, choć do tej pory firma nie osiągnęła najlepszych efektów. Nie można jednak uznać, że wszystkie produkty w ostatnim czasie okazały się niewystarczająco dobre — po prostu borykały się problemami, z którymi mierzą się także inne rozwiązania oparte na AI. Tym razem jeden z oddziałów firmy, a dokładniej Google DeepMind, zaprezentował swoje nowe osiągnięcia. Dotyczą one możliwości generowania ścieżek dźwiękowych do materiałów wideo. Technologia V2A pozwala również na sprecyzowanie tego, co chcemy osiągnąć, poprzez udzielenie podpowiedzi tekstowej — rozwiązanie nie potrzebuje jednak ich do działania i właśnie to wyróżnia je od innych. Finalny efekt może być zaskakująco dobry.

ImageFX - Google wprowadza swój generator obrazów. W grafikach znajdzie się znak wodny, który widzą tylko maszyny

W całym procesie najpierw kodowane jest wideo oraz opis tekstowy, które następnie przechodzą przez model dyfuzyjny. Po tych krokach tworzona jest skompresowana ścieżka audio, która później jest dekodowana. Technologia V2A może więc być użyta nie tylko z modelami, które są w stanie tworzyć wideo (wszystkie przykłady wygenerowano z użyciem autorskiego modelu Veo), ale również z gotowymi materiałami wideo z dawnych lat, do których nie ma ścieżki audio. Rozwiązanie stwarza nowe możliwości w tej dziedzinie, choć nie jest oczywiście idealne. Jakość audio jest zależna od wejściowej jakości wideo, ponieważ przy generowaniu ścieżki analizowane są piksele. Możliwa jest także synchronizacja ruchu warg ze stworzonym dźwiękiem, natomiast na ten moment działanie nie jest jeszcze zadowalające (ostatnie wideo). Google udostępni technologię V2A dopiero wtedy, gdy uzna to za słuszne — chodzi o kwestie bezpieczeństwa.

Źródło: Google

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Google wdraża nowe narzędzie zarządzania subskrypcjami w Gmail, usprawniające obsługę newsletterów i promocji

Asystent Gemini zyskuje nowe uprawnienia systemowe do WhatsApp, SMS i połączeń telefonicznych. Możesz to wyłączyć

Jack Dorsey wypuszcza BitChat - komunikator peer-to-peer działający w sieci mesh Bluetooth LE bez dostępu do internetu

Badacze ukrywają prompty AI w publikacjach naukowych, aby manipulować systemami recenzji peer-review

Czym jest Flatpak i jaki ma związek z Flathub? Krótkie omówienie Linuksowych rozwiązań i garść nowych statystyk

Liczba komentarzy: 12

Komentarze:

Załaduj komentarze

Google chce wprowadzić generowanie filmów na inny poziom. Technologia V2A stworzy do nich ścieżki dźwiękowe

Google podzieliło się rezultatami, jakie już teraz można osiągnąć przy pomocy technologii V2A. Dzięki niej nieme filmy mogą ożyć, ponieważ generowana jest do nich ścieżka dźwiękowa. Całość wypada naprawdę dobrze.

Veo - nowy generator wideo korzystający z mocy AI od Google. Nadchodzi pierwszy poważny rywal dla Sory od OpenAI

ImageFX - Google wprowadza swój generator obrazów. W grafikach znajdzie się znak wodny, który widzą tylko maszyny

Powiązane publikacje

Google wdraża nowe narzędzie zarządzania subskrypcjami w Gmail, usprawniające obsługę newsletterów i promocji

Asystent Gemini zyskuje nowe uprawnienia systemowe do WhatsApp, SMS i połączeń telefonicznych. Możesz to wyłączyć

Jack Dorsey wypuszcza BitChat - komunikator peer-to-peer działający w sieci mesh Bluetooth LE bez dostępu do internetu

Badacze ukrywają prompty AI w publikacjach naukowych, aby manipulować systemami recenzji peer-review

Czym jest Flatpak i jaki ma związek z Flathub? Krótkie omówienie Linuksowych rozwiązań i garść nowych statystyk

Komentarze:

Test obudowy komputerowej Corsair Frame 5000D RS - Większa i lepiej wyposażona wersja Corsair Frame 4000D RS

Test smartfona Nothing Phone (3) - wydajny i oryginalny, ale czy na pewno godny miana flagowca?

Test smartfona OnePlus Nord CE5 - na zewnątrz muzeum, w środku... liceum? Oto prawdziwy sleeper wśród smartfonów

Test smartfona vivo V50 - stylowy model z pojemną baterią. Zachwyci amatorów fotografii, ale rozczaruje maniaków wydajności

Test obudowy komputerowej FSP M580 - Jednolita szklana tafla i cztery wentylatory z efektem lustra w rozsądnej cenie

Ugoda Epic Games i Samsunga w sprawie funkcji Auto Blocker blokującej instalację Epic Games Store na smartfonach Galaxy

Google wdraża nowe narzędzie zarządzania subskrypcjami w Gmail, usprawniające obsługę newsletterów i promocji

Deepfake głosu Marco Rubio wykorzystany w cyberataku na ministrów spraw zagranicznych i gubernatorów poprzez Signala

Niższe ceny na karty graficzne GeForce RTX 5000, pamięci RAM, dyski SSD, zasilacze i sprzęt przydatny na wakacjach

Max – filmowe i serialowe nowości VOD na 7 - 13 lipca 2025. Wśród premier Wiking, 40-letni prawiczek, Zła kobieta oraz The Outrun

Test wydajności DOOM: The Dark Ages - Path Tracing to piekielne wymagania sprzętowe. Porównanie wydajności i jakości grafiki

AMD Radeon RX 9070 XT - modele z pamięciami GDDR6 od Samsunga są trochę wolniejsze od tych z modułami od SK hynix

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

Karty graficzne AMD Radeon RX 9000 w cenach blisko MSRP. Sytuacja architektury RDNA 4 wygląda już dużo lepiej

NVIDIA GeForce RTX 5070 SUPER oraz GeForce RTX 5070 Ti SUPER - Nadchodzą lepiej wyposażone karty graficzne Blackwell

O portalu PurePC

Najważniejsze

Znajdź PurePC na