Команда Rumi виявила, що нові мовні моделі GPT-o3 та GPT-o4-mini вбудовують у свої відповіді спеціальні символи-водяні знаки. Йдеться про невидимі для ока розділювачі, такі як Narrow No-Break Space (U+202F), які виглядають як звичайні пробіли, але мають інший код. Виявити ці маркери можна, наприклад, через текстові редактори на кшталт Sublime Text або спеціальні онлайн-інструменти.
Цікаво, що водяні знаки з’являються переважно в довгих текстах, наприклад у відповідях на запити типу «Напиши есе про Міністерство освіти». При цьому в старіших версіях GPT, таких як GPT-4o, їх не зафіксовано.
Очевидно, що це — перша спроба OpenAI маркувати згенеровані тексти після оголошення про тестування водяних знаків на зображеннях. Офіційно компанія про це нововведення не повідомляла, ймовірно, щоб уникнути масового обходу захисту.
Видалити такі водяні знаки нескладно: достатньо замінити спеціальні символи стандартними пробілами за допомогою будь-якого редактора. Це ставить під сумнів довгострокову ефективність такого методу виявлення AI-контенту.
Чому це важливо
Наразі ChatGPT безкоштовний для студентів до кінця травня, і масове використання моделей для написання дипломних і курсових робіт лише посилюється. Небезпека полягає в тому, що студенти, які бездумно копіюють згенеровані відповіді, можуть бути викриті викладачами, що використовують спеціальні інструменти для виявлення невидимих маркерів. Однак ті, хто знає про водяні знаки, зможуть легко їх обійти, що створює нерівні умови для оцінювання.
Плюси й мінуси водяних знаків
Перевага такого маркування — майже нульова ймовірність помилкового обвинувачення у плагіаті, оскільки студенти навряд чи використовують Unicode-символи типу NNBSP у своїх текстах самостійно. Недолік — простота обходу: знайти і замінити спецсимволи можна за лічені хвилини.
Що буде далі
Імовірно, вбудовані водяні знаки — лише експеримент OpenAI, який можуть згодом скасувати, як це було з неефективним AI-детектором. У Rumi переконані: замість технічних обмежень потрібно розвивати інший підхід — відстежувати процес написання робіт, підтримувати рефлексію щодо використання AI та сприяти розвитку навичок колаборації й аналізу.