«Вікіпедія» страждає від активного використання її ресурсів штучним інтелектом (ШІ). Боти, які збирають дані для навчання моделей ШІ, значно збільшують навантаження на сервери енциклопедії, що призводить до зростання витрат на підтримку інфраструктури.
Основні моменти
- Різке зростання трафіку від ШІ-ботів – за останні три місяці він збільшився на 50%;
- Боти копіюють не тільки текст, а й мультимедійний контент – зображення та інші медіафайли;
- Навантаження на сервери зростає – система «Вікіпедії» спроєктована для обробки запитів людей, а не безперервного парсингу ботами;
- Фонд Wikimedia змушений обмежувати роботу ШІ-скрейперів – вводяться індивідуальні ліміти швидкості, а деяким ботам взагалі блокують доступ;
- Розробляється план боротьби з ШІ-краулерами – Wikimedia працює над політикою «Відповідального використання інфраструктури»;
- Подібна проблема була у Reddit у 2023 році – тоді компанія змусила Microsoft платити за використання своїх даних.
Висновок
Зростання популярності ШІ призводить до нових викликів для відкритих ресурсів, як-от «Вікіпедія». Величезний трафік від ботів несе фінансові та технічні ризики, змушуючи організації переглядати свою політику доступу до даних.