Meta miała wykorzystywać do treningu sztucznej inteligencji książki ściągnięte nielegalnie za pomocą sieci torrent
Do przeprowadzenia treningu sztucznej inteligencji na pełną skalę potrzebna jest nie tylko duża moc obliczeniowa, ale także odpowiednie ilości danych. To oczywiście rodzi pokusę pozyskiwania ich w nielegalny sposób. Firma Meta, czyli właściciel między innymi platformy Facebook, musi obecnie mierzyć się z oskarżeniami dotyczącymi wykorzystywania do treningu AI książek, które zostały ściągnięte w nieuprawniony sposób za pośrednictwem sieci torrent.
W toku procesu toczącego się przeciwko firmie Meta, ujawniono dokumenty, które mogą wskazywać, że przedsiębiorstwo pobrało nielegalnie z torrentów ponad 80 TB danych. Miały one zostać wykorzystane do treningu AI.
Hasła użytkowników Facebooka były podane na tacy. Meta otrzymała z tego powodu dość dotkliwą karę
Przeciwko firmie Meta toczy się od pewnego czasu proces sądowy w USA. Chodzi o przypadki naruszenia praw autorskich oraz nieuczciwą konkurencję podczas treningu modelu sztucznej inteligencji. Jak wynika z udostępnionych dokumentów, w celu pozyskania danych treningowych pracownicy firmy ściągnęli w latach 2022-2024 nielegalnie 81,7 TB danych za pośrednictwem sieci torrent. Wśród nich znalazły się między innymi cyfrowe wersje książek. Korzystano przy tym z takich źródeł torrentów, jak Anna’s Archive, Z-Library czy LibGen. Co ciekawe, spotykało się to ze sprzeciwem niektórych pracowników Meta. Jeden z nich twierdził, że nie powinno się tego robić i należy postawić temu granice. Inny z kolei sugerował, że są to działania wykraczające poza zasady etyczne firmy, ponieważ serwisy udostępniające omawiane torrenty jawnie naruszają prawa autorskie.
Facebook, Instagram, WhatsApp i Messenger integrują się z asystentem Meta AI. Nowy model AI Llama 3 już dostępny
Opublikowane dokumenty sugerują także, że w styczniu 2023 roku prezes Meta - Mark Zuckerberg - wziął udział w spotkaniu, podczas którego zasugerował, że sprawa (w domyśle wykorzystania danych z torrentów) powinna zostać popchnięta do przodu. W kwietniu 2023 roku pojawiły się zaś dyskusje na temat wykorzystania VPN w celu ukrycia adresów IP firmy Meta podczas ściągania danych z sieci. Rozważano też zaangażowanie w sprawę prawników, co miałoby zabezpieczyć przedsiębiorstwo na wypadek, gdyby sprawa wyszła na jaw. Nie jest to oczywiście pierwszy przypadek, kiedy pojawiają się wątpliwości etyczne dotyczące treningu sztucznej inteligencji. Trudno jednak na tę chwilę wyrokować, jaka będzie decyzja sądu. Na ostateczne rozstrzygnięcie sprawy zapewne nieco poczekamy, ponieważ jest spore prawdopodobieństwo, że któraś ze stron złoży odwołanie od wyroku.
Unsealed court documents from February 5th, 2024, in Kadrey v. Meta show Meta (formerly Facebook) illegally torrented 81.7TB of data from "shadow libraries" such as Anna's Archive, Z-Library, and LibGen to train Meta artificial intelligence.
— vx-underground (@vxunderground) February 8, 2025
Highlights include:
- A senior AI… pic.twitter.com/Bqf60Hhbb6
Powiązane publikacje

Utah jako pierwszy stan USA wprowadza obowiązek weryfikacji wieku i zgody rodziców w sklepach z aplikacjami
25
Mindfactory oficjalnie wraca do gry, postępowanie naprawcze zaczyna przynosić efekty w postaci dostępności kart graficznych
4
Programiści blokują ruch z całych krajów z powodu nadmiernej aktywności crawlerów systemów AI
19
Qualcomm oskarża ARM o praktyki monopolistyczne i składa skargi do globalnych organów antymonopolowych
7