Boty AI Przeciążają Serwery Wikipedii

Image by Oberon Copeland, from Unsplash

Boty AI Przeciążają Serwery Wikipedii

Przeczytasz w: 2 min

Fundacja Wikimedia wyraziła zaniepokojenie rosnącym obciążeniem swoich serwerów spowodowanym przez automatyczne boty gromadzące dane do szkolenia modeli sztucznej inteligencji.

W pośpiechu? Oto najważniejsze fakty:

  • Boty AI pobierają treści z Wikimedia na rekordowym poziomie.
  • Boty spowodowały wzrost zużycia przepustowości multimediów o 50%.
  • 65% ruchu generującego wysokie koszty pochodzi teraz od crawlerów.

Fundacja poinformowała w ostatnim poście, że ruch generowany przez maszyny nadal rośnie w niezwykłym tempie, podczas gdy ludzie stanowią tylko niewielką część tego ruchu.

„Od stycznia 2024 roku obserwujemy wzrost o 50% ilości przepustowości używanej do pobierania treści multimedialnych,” mówi wpis.

„Ten wzrost nie wynika z aktywności ludzkich czytelników, ale głównie z automatycznych programów, które przeszukują katalog obrazów Wikimedia Commons o otwartej licencji, aby dostarczać obrazy do modeli AI,” dodano w poście.

Boty znane jako crawlers kradną ogromne ilości danych z projektów Wikimedia, w tym z Wikipedii i Wikimedia Commons, bez właściwego uznanie autorstwa lub oficjalnych narzędzi dostępu. Proces ten utrudnia nowym użytkownikom odkrywanie Wikimedia i nadmiernie obciąża ich systemy techniczne.

Na przykład, post zauważa, że strona Wikipedii o Jimmy’m Carterze odnotowała ponad 2,8 miliona wyświetleń w dniu jego śmierci w grudniu 2024 roku. Film z debaty z 1980 roku spowodował znaczny wzrost ruchu na stronie. Również film z jego debaty z 1980 roku spowodował wzrost ruchu. Wikimedia poradziło sobie z tym – ale ledwo. Głównym problemem, według inżynierów, jest ciągły napływ ruchu botów.

„65% naszego najdroższego ruchu pochodzi od botów” – napisała Fundacja. Boty „masowo czytają” treści, zwłaszcza mniej popularne strony, co wywołuje kosztowne zapytania do głównych centrów danych Wikimedia.

Chociaż treści Wikimedia są dostępne za darmo, ich serwery już nie. „Nasza treść jest darmowa, nasza infrastruktura już nie” – powiedziała Fundacja. Zespół nadal opracowuje metody promowania „odpowiedzialnego korzystania z infrastruktury”, zachęcając deweloperów do korzystania z API, zamiast skrobania całej strony.

Problem dotyka Wikimedia, jak również liczne inne strony internetowe i wydawców. Jednak dla największej na świecie platformy otwartej wiedzy, stanowi zagrożenie dla stabilności usług, na które polega miliony osób.

Spodobał Ci się ten artykuł? Oceń go!
Był okropny Nie podobał mi się Był w porządku Był całkiem dobry! Był super!

Cieszymy się, że doceniasz to, co robimy!

Cenimy Twoją opinię. Czy możemy liczyć na ocenę na Trustpilot? Zajmie Ci to tylko chwilę. Będziemy zobowiązani. Dziękujemy za wsparcie!

Oceń nas na Trustpilot
0 Na podstawie głosów 0 użytkowników
Tytuł
Komentarz
Dziękujemy za Twoją opinię
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Zostaw komentarz

Loader
Loader Pokaż więcej...