Натискаючи “Прийняти всі куки”, від підтверджуєте свою згоду на зберігання файлів cookie на вашому пристрої для покращення навігації сайту, аналізу використання сайту та допомоги в наших маркетингових зусиллях. Перегляньте нашу Політику конфіденційності для отримання додаткової інформації.
Налаштування файлів cookie

Програми для виявлення ШІ дискримінують контент не англомовних користувачів

Згідно з останнім дослідженням від The Guardian, не носії англійської мови, які створюють будь-який текстовий контент англійською мають бути вдвічі уважнішими. Їхнє есе може бути помилково прийнято за контент, що створив штучний інтелект.

Програми, які використовуються для ідентифікації використання ШІ при створенні текстового контенту, можуть ненавмисно дискримінувати людей, для яких англійська не є рідною.

Дослідники виявили, що сім популярних детекторів тексту зі ШІ часто позначали матеріали не носіїв англійської, як ті, що створені ШІ. Це упередження має значні наслідки для студентів, науковців і кандидатів на роботу.

Як проводилося дослідження

Поява ChatGPT, який може писати есе та створювати комп’ютерний код, змусила багатьох викладачів розглядати виявлення ШІ як важливий контрзахід у боротьбі зі списуванням у 21 столітті. Але детектори можуть вводити в оману. Під керівництвом Джеймса Зоу, доцента кафедри біомедичних даних у Стенфордському університеті, вчені провели тестування 91 англійського есе, написаного не носіями англійської мови. Вони використовували сім популярних детекторів GPT, щоб оцінити їх ефективність.

Більша частина есе, які були частиною іспиту з англійської як іноземної (TOEFL) були помилково визначені як створені ШІ. Одна програма навіть позначила 98% есе як написані ШІ. У той час, коли оцінювали есе, написані англомовними восьмикласниками в США, понад 90% було правильно ідентифіковано як ті, що створені людиною.

Справа в«емоційності» тексту

Дослідники опублікували свої висновки в журналі Patterns і пояснили дискримінацію тим, як детектори визначають, створений текст людиною чи ШІ.

Програми аналізують показник «емоційність тексту», що вимірює рівень здивування або збентеження, який відчуває модель генеративної мови під час спроби передбачити наступне слово в реченні. Якщо програма може легко передбачити наступне слово, то цей показник автоматично стає низьким.

Адже такі ШІ, як ChatGPT, можуть створювати текст із низьким рівнем емоційності. І через те, що автори, які не є носіями використовують загальні слова і конструкції, їхній контент можна помилково прийняти за штучний.

Автори дослідження наголосили на серйозних наслідках детекторів GPT для не носіїв і наголосили на необхідності розв'язання цих проблем, щоб запобігти дискримінаційним ситуаціям.

Читайте також: Google дозволив собі збирати будь-які дані для навчання штучного інтелекту. Що це означає

«Наслідки детекторів GPT для не носіїв англійської є серйозними, і ми повинні продумати їх, щоб уникнути ситуацій дискримінації. У сфері освіти, яка є, мабуть, найважливішим ринком для детекторів GPT, іноземні студенти несуть більше ризиків хибних звинувачень у списуванні, що може бути шкідливим для академічної кар’єри та психологічного стану студента», — додали дослідники.

Яна Оттербахер з Кіпрського центру алгоритмічної прозорості Відкритого університету Кіпру має свою думку щодо питання з ШІ. Вона зазначила, що замість того, щоб боротися зі ШІ за допомогою додаткового ШІ, люди повинні розвивати академічну культуру, яка сприяє використанню генеративного ШІ у творчому та етичному напрямках. ChatGPT постійно збирає дані від громадськості та вчиться догоджати своїм користувачам. Тому зрештою, бот навчиться перехитрити будь-який детектор.

Telegram logo

Швидкий доступ до новин та ексклюзивних матеріалів – у нашому каналі в Telegram.

Читайте також