Automatyczne boty AI przeciążają serwery Wikimedia. Wzrost wykorzystania pasma o połowę zagraża stabilności projektów

Maciej Lewczuk | 04-04-2025 11:30 |

Internet

Automatyczne boty AI przeciążają serwery Wikimedia. Wzrost wykorzystania pasma o połowę zagraża stabilności projektów Wikimedia Foundation, organizacja zarządzająca Wikipedią i pokrewnymi projektami, alarmuje o znaczącym wzroście ruchu generowanego przez boty AI, które masowo pobierają treści multimedialne w celu trenowania modeli sztucznej inteligencji. To zjawisko prowadzi do przeciążenia infrastruktury, a także znacznego zwiększenia kosztów operacyjnych, stawiając pod znakiem zapytania stabilność, jak również dostępność zasobów dla użytkowników.

Od stycznia 2024 roku zaobserwowaliśmy wzrost wykorzystania pasma do pobierania treści multimedialnych o 50%. Ten wzrost pochodzi głównie od zautomatyzowanych programów. – Wikimedia Foundation

Programiści blokują ruch z całych krajów z powodu nadmiernej aktywności crawlerów systemów AI

Wikimedia Foundation, organizacja non-profit zarządzająca Wikipedią oraz innymi projektami opartymi na współtworzeniu treści, zmaga się z nowym wyzwaniem. Od początku 2024 roku odnotowano 50-procentowy wzrost wykorzystania pasma do pobierania treści multimedialnych. Źródłem tego wzrostu są głównie zautomatyzowane boty, które masowo pobierają obrazy z Wikimedia Commons w celu trenowania modeli sztucznej inteligencji. Analiza przeprowadzona przez Wikimedia Foundation wykazała, że co najmniej 65% ruchu generowanego przez najbardziej obciążające zasoby treści pochodzi od botów, mimo że stanowią one około 35% całkowitej liczby odsłon stron. Boty te często odwiedzają mniej popularne artykuły, co zmusza serwery do częstszego sięgania po dane z głównego centrum danych, zwiększając obciążenie infrastruktury. Wzmożony ruch botów AI nie tylko obciąża serwery, ale również prowadzi do wzrostu kosztów operacyjnych.

Cloudflare wprowadza darmowe narzędzie, które blokuje boty wyszukujące w Internecie treści do treningu AI

Infrastruktura Wikimedia jest zaprojektowana tak, aby radzić sobie z nagłymi wzrostami ruchu spowodowanymi przez użytkowników podczas ważnych wydarzeń. Jednak obecny poziom ruchu generowanego przez boty jest bezprecedensowy i stanowi rosnące ryzyko dla stabilności, a także dostępności usług. Fundacja aktywnie monitoruje sytuację i podejmuje działania mające na celu ograniczenie wpływu botów na infrastrukturę. Zespół ds. niezawodności witryny poświęca znaczną ilość czasu i zasobów na blokowanie niepożądanych crawlerów, aby zapobiec zakłóceniom dla regularnych użytkowników. Niemniej problem pozostaje poważnym wyzwaniem, które wymaga dalszych działań i współpracy z twórcami botów, a także społecznością AI. Zjawisko masowego pobierania danych przez boty AI nie jest unikalne dla Wikimedia. Wiele organizacji i serwisów internetowych doświadcza podobnych problemów, gdy ich zasoby są wykorzystywane do trenowania modeli sztucznej inteligencji bez odpowiednich uzgodnień czy też rekompensat. To rodzi pytania o etykę, a także o odpowiedzialność w zakresie wykorzystywania publicznie dostępnych danych, jak również o potrzebę ustanowienia nowych standardów i regulacji w tej dziedzinie.

Źródło: Ars Technica, TechCrunch, PCMag

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Rejestracja wyjazdu w mObywatel krok po kroku. Logowanie Odyseusza przez Profil Zaufany, e-dowód i bankowość

Ojciec Internetu schodzi ze sceny. W tle pada ostrzeżenie, którego branża AI nie powinna zlekceważyć

Amber Cable to 1500 km nowego światłowodu na Bałtyku, ale publicznie wciąż brakuje konkretnych parametrów

Wybierz nazwę użytkownika na WhatsApp. Rezerwacje już ruszyły, ale nowa funkcja będzie dostępna z biegiem czasu

Szkoły dostały internet, ale utknęły na korytarzu. NASK wydaje 254 mln zł, żeby wreszcie działało to w klasach

Liczba komentarzy: 27

Komentarze:

Załaduj komentarze

Automatyczne boty AI przeciążają serwery Wikimedia. Wzrost wykorzystania pasma o połowę zagraża stabilności projektów

Od stycznia 2024 roku zaobserwowaliśmy wzrost wykorzystania pasma do pobierania treści multimedialnych o 50%. Ten wzrost pochodzi głównie od zautomatyzowanych programów. – Wikimedia Foundation

Programiści blokują ruch z całych krajów z powodu nadmiernej aktywności crawlerów systemów AI

Cloudflare wprowadza darmowe narzędzie, które blokuje boty wyszukujące w Internecie treści do treningu AI

Powiązane publikacje

Rejestracja wyjazdu w mObywatel krok po kroku. Logowanie Odyseusza przez Profil Zaufany, e-dowód i bankowość

Ojciec Internetu schodzi ze sceny. W tle pada ostrzeżenie, którego branża AI nie powinna zlekceważyć

Amber Cable to 1500 km nowego światłowodu na Bałtyku, ale publicznie wciąż brakuje konkretnych parametrów

Wybierz nazwę użytkownika na WhatsApp. Rezerwacje już ruszyły, ale nowa funkcja będzie dostępna z biegiem czasu

Szkoły dostały internet, ale utknęły na korytarzu. NASK wydaje 254 mln zł, żeby wreszcie działało to w klasach

Komentarze:

Recenzja DDPAI Z90 Master 3CH. Wideorejestrator 4K + 4K + 3K, z doświetlaniem IR oraz podwójną pamięcią

Jaka myszka do grania? Jaka klawiatura mechaniczna? Poradnik zakupowy i polecany sprzęt dla graczy na lipiec 2026

Recenzja DDPAI Z60 Pro 3CH. Wideorejestrator 4K z trzema kamerami, w akceptowalnej cenie

Test wydajności Assassin's Creed Black Flag Resynced - Wymagania sprzętowe zmiatają z pokładu? Piraci puszczą wszystkich bez gaci?

Test procesora AMD Ryzen 7 7700X3D - Słabsza wersja AMD Ryzen 7 7800X3D... Jednak cena na poziomie szybszego modelu

Tomb Raider: Legacy of Atlantis - nowy gameplay prezentujący poruszanie się i eksplorację w grze

Deepfake nie ma szans? NVIDIA pokazuje narzędzie, które łapie fałszywe wideo z 92-procentową skutecznością w 22 milisekundy

Google szykuje Frozen v2. Chip pod Gemini ma dać 6–10x więcej tokenów z wata niż obecne TPU

Gracz przykręcił do GeForce RTX 4060 radiator wielkości cegły. Powstała z tego najszybsza pasywnie chłodzona karta graficzna

Steam Machine został wyceniony z myślą o przyszłych wzrostach cen pamięci RAM. Wywiad z inżynierami Valve ujawnia kulisy

Wyniki wielkiego konkursu na 20 urodziny PurePC! Sprawdź czy wygrałeś jedną z kilkudziesięciu nagród

Steam Machine z oficjalną ceną. Valve właśnie zgasiło entuzjazm graczy - aż trudno uwierzyć w te kwoty!

GeForce RTX 5090 Founders Edition padł w redakcyjnym teście. Kabel 12V-2x6 stopił się po obu stronach

Jest odczyt Hot Spot na NVIDIA GeForce RTX 5000 - Diagnostyczne programy zaczęły podawać informacje o temperaturach

Karty graficzne AMD Radeon RX 7000 z serii RDNA 3 od dzisiaj oficjalnie z dostępem do ulepszonego upscalingu FSR 4.1

O portalu PurePC

Najważniejsze

Znajdź PurePC na