Startup Runway, którego wspierała NVIDIA i Google, ukradł tysiące filmów z YouTube, aby szkolić swój generator wideo
Usługi oparte na sztucznej inteligencji, a konkretniej te, które mają za zadanie tworzyć obrazy i wideo, musiały tak jak inne zostać najpierw przeszkolone na dużych zbiorach danych. Większość firm "pożyczyła" sobie dostępne w internecie materiały, aby osiągnąć jak najlepsze rezultaty. Teraz na jaw wyszły informacje, które wskazują, że startup Runway wykorzystał tysiące filmów z platformy YouTube oraz z co najmniej jednego pirackiego serwisu, aby szkolić swój generator wideo.
Startup Runway został oskarżony o bezprawne wykorzystywanie materiałów z portalu YouTube, a także serwisu, który oferuje dostęp do pirackich kopii filmów i seriali, w celu szkolenia swojego generatora wideo o tej samej nazwie.
Runway Gen-2 jest już dostępny dla każdego. Wszyscy mogą spróbować stworzyć wideo z opisu tekstowego
Aktualnie startup Runway oferuje dostęp do generatora wideo o nazwie Gen-3 Alpha, który pozwala każdemu użytkownikowi stworzyć krótki film o dowolnej tematyce w każdym stylu. Jednak aby uzyskać realistyczny poziom generowanych materiałów wideo, najpierw trzeba odpowiednio wyszkolić dany model AI na wspomnianym zbiorze danych. Dziennikarzom z portalu 404 Media udało się uzyskać dostęp do arkusza kalkulacyjnego, który zawiera odnośniki do niemal 4 tys. kanałów z serwisu YouTube (link) wraz z krótkimi opisami tego, jakie treści można na nich znaleźć. Ta sporej wielkości baza została utworzona przez pracowników Runway i wskazywała materiały o wysokiej jakości, których można użyć do szkolenia autorskiego generatora wideo.
Sora - największa rewolucja w świecie AI od czasu ChatGPT. Powstał fotorealistyczny generator wideo z opisów tekstowych
Znalezione zostały również odnośniki do strony z pirackimi kopiami filmów i seriali animowanych. Startup stale otrzymuje finansowanie o całkiem sporej wartości od wielu dużych firm, a tylko w 2023 roku pochodziło ono od takich przedsiębiorstw jak Google, czy też NVIDIA. Nie wiemy oczywiście, jaka treść wideo ze stworzonej listy była użyta do szkolenia modeli AI, natomiast startup posłużył się pająkiem internetowym (ang. web crawler), który korzystał z serwerów pośredniczących (ang. proxy), aby masowo pobierać omawiane materiały z platformy YouTube. Runway nie odpowiedział za stawiane zarzuty w żaden sposób. Nie jest to jedyny przypadek, w którym konkretne rozwiązanie AI kradnie publicznie dostępne dane, gdyż stworzona przez OpenAI Sora także szkoliła się na filmach z serwisu YouTube.
Powiązane publikacje

Kolejna usługa od Google wkrótce straci ważność. Gry bez instalacji na Androidzie odejdą jeszcze w 2025 roku
1
AMD ROCm 7 - premiera platformy obliczeniowej dla sztucznej inteligencji i rynku HPC, która przynosi znaczy wzrost wydajności
11
Bielik AI z oficjalnym wsparciem NVIDIA. Polski model językowy wkracza do europejskiej ekstraklasy
36
Android 16 już dostępny, ale bez Material 3 Expressive. Nadchodzą powiadomienia na żywo i alternatywa dla Samsung DeX
24