Startup Runway, którego wspierała NVIDIA i Google, ukradł tysiące filmów z YouTube, aby szkolić swój generator wideo
Usługi oparte na sztucznej inteligencji, a konkretniej te, które mają za zadanie tworzyć obrazy i wideo, musiały tak jak inne zostać najpierw przeszkolone na dużych zbiorach danych. Większość firm "pożyczyła" sobie dostępne w internecie materiały, aby osiągnąć jak najlepsze rezultaty. Teraz na jaw wyszły informacje, które wskazują, że startup Runway wykorzystał tysiące filmów z platformy YouTube oraz z co najmniej jednego pirackiego serwisu, aby szkolić swój generator wideo.
Startup Runway został oskarżony o bezprawne wykorzystywanie materiałów z portalu YouTube, a także serwisu, który oferuje dostęp do pirackich kopii filmów i seriali, w celu szkolenia swojego generatora wideo o tej samej nazwie.
Runway Gen-2 jest już dostępny dla każdego. Wszyscy mogą spróbować stworzyć wideo z opisu tekstowego
Aktualnie startup Runway oferuje dostęp do generatora wideo o nazwie Gen-3 Alpha, który pozwala każdemu użytkownikowi stworzyć krótki film o dowolnej tematyce w każdym stylu. Jednak aby uzyskać realistyczny poziom generowanych materiałów wideo, najpierw trzeba odpowiednio wyszkolić dany model AI na wspomnianym zbiorze danych. Dziennikarzom z portalu 404 Media udało się uzyskać dostęp do arkusza kalkulacyjnego, który zawiera odnośniki do niemal 4 tys. kanałów z serwisu YouTube (link) wraz z krótkimi opisami tego, jakie treści można na nich znaleźć. Ta sporej wielkości baza została utworzona przez pracowników Runway i wskazywała materiały o wysokiej jakości, których można użyć do szkolenia autorskiego generatora wideo.
Sora - największa rewolucja w świecie AI od czasu ChatGPT. Powstał fotorealistyczny generator wideo z opisów tekstowych
Znalezione zostały również odnośniki do strony z pirackimi kopiami filmów i seriali animowanych. Startup stale otrzymuje finansowanie o całkiem sporej wartości od wielu dużych firm, a tylko w 2023 roku pochodziło ono od takich przedsiębiorstw jak Google, czy też NVIDIA. Nie wiemy oczywiście, jaka treść wideo ze stworzonej listy była użyta do szkolenia modeli AI, natomiast startup posłużył się pająkiem internetowym (ang. web crawler), który korzystał z serwerów pośredniczących (ang. proxy), aby masowo pobierać omawiane materiały z platformy YouTube. Runway nie odpowiedział za stawiane zarzuty w żaden sposób. Nie jest to jedyny przypadek, w którym konkretne rozwiązanie AI kradnie publicznie dostępne dane, gdyż stworzona przez OpenAI Sora także szkoliła się na filmach z serwisu YouTube.
Powiązane publikacje

Duolingo stawia na AI. Chodzi o automatyzację procesów, a także redukcję kontraktorów w edukacyjnej rewolucji
22
Microsoft Recall oraz Click to Do trafiły do zapoznawczej aktualizacji Windowsa 11 dla komputerów Copilot+ AI
17
Dystrybucja OpenMandriva Lx 6.0 Rock już dostępna. Stabilna odsłona z KDE Plasma 6, która oferuje jądro Linux 6.15
28
Windows 11 - kwietniowe aktualizacje systemu i zabezpieczeń powodują błędy BSOD, a także problemy z logowaniem
78