Usługi oparte na sztucznej inteligencji, a konkretniej te, które mają za zadanie tworzyć obrazy i wideo, musiały tak jak inne zostać najpierw przeszkolone na dużych zbiorach danych. Większość firm "pożyczyła" sobie dostępne w internecie materiały, aby osiągnąć jak najlepsze rezultaty. Teraz na jaw wyszły informacje, które wskazują, że startup Runway wykorzystał tysiące filmów z platformy YouTube oraz z co najmniej jednego pirackiego serwisu, aby szkolić swój generator wideo.

Startup Runway został oskarżony o bezprawne wykorzystywanie materiałów z portalu YouTube, a także serwisu, który oferuje dostęp do pirackich kopii filmów i seriali, w celu szkolenia swojego generatora wideo o tej samej nazwie.

Aktualnie startup Runway oferuje dostęp do generatora wideo o nazwie Gen-3 Alpha, który pozwala każdemu użytkownikowi stworzyć krótki film o dowolnej tematyce w każdym stylu. Jednak aby uzyskać realistyczny poziom generowanych materiałów wideo, najpierw trzeba odpowiednio wyszkolić dany model AI na wspomnianym zbiorze danych. Dziennikarzom z portalu 404 Media udało się uzyskać dostęp do arkusza kalkulacyjnego, który zawiera odnośniki do niemal 4 tys. kanałów z serwisu YouTube (link) wraz z krótkimi opisami tego, jakie treści można na nich znaleźć. Ta sporej wielkości baza została utworzona przez pracowników Runway i wskazywała materiały o wysokiej jakości, których można użyć do szkolenia autorskiego generatora wideo.

Znalezione zostały również odnośniki do strony z pirackimi kopiami filmów i seriali animowanych. Startup stale otrzymuje finansowanie o całkiem sporej wartości od wielu dużych firm, a tylko w 2023 roku pochodziło ono od takich przedsiębiorstw jak Google, czy też NVIDIA. Nie wiemy oczywiście, jaka treść wideo ze stworzonej listy była użyta do szkolenia modeli AI, natomiast startup posłużył się pająkiem internetowym (ang. web crawler), który korzystał z serwerów pośredniczących (ang. proxy), aby masowo pobierać omawiane materiały z platformy YouTube. Runway nie odpowiedział za stawiane zarzuty w żaden sposób. Nie jest to jedyny przypadek, w którym konkretne rozwiązanie AI kradnie publicznie dostępne dane, gdyż stworzona przez OpenAI Sora także szkoliła się na filmach z serwisu YouTube.

Źródło: TheVerge