Програми для виявлення ШІ дискримінують контент не англомовних користувачів

13.7.2023 10:00

Згідно з останнім дослідженням від The Guardian, не носії англійської мови, які створюють будь-який текстовий контент англійською мають бути вдвічі уважнішими. Їхнє есе може бути помилково прийнято за контент, що створив штучний інтелект.

Програми, які використовуються для ідентифікації використання ШІ при створенні текстового контенту, можуть ненавмисно дискримінувати людей, для яких англійська не є рідною.

Дослідники виявили, що сім популярних детекторів тексту зі ШІ часто позначали матеріали не носіїв англійської, як ті, що створені ШІ. Це упередження має значні наслідки для студентів, науковців і кандидатів на роботу.

Як проводилося дослідження

Поява ChatGPT, який може писати есе та створювати комп’ютерний код, змусила багатьох викладачів розглядати виявлення ШІ як важливий контрзахід у боротьбі зі списуванням у 21 столітті. Але детектори можуть вводити в оману. Під керівництвом Джеймса Зоу, доцента кафедри біомедичних даних у Стенфордському університеті, вчені провели тестування 91 англійського есе, написаного не носіями англійської мови. Вони використовували сім популярних детекторів GPT, щоб оцінити їх ефективність.

Більша частина есе, які були частиною іспиту з англійської як іноземної (TOEFL) були помилково визначені як створені ШІ. Одна програма навіть позначила 98% есе як написані ШІ. У той час, коли оцінювали есе, написані англомовними восьмикласниками в США, понад 90% було правильно ідентифіковано як ті, що створені людиною.

Справа в«емоційності» тексту

Дослідники опублікували свої висновки в журналі Patterns і пояснили дискримінацію тим, як детектори визначають, створений текст людиною чи ШІ.

Програми аналізують показник «емоційність тексту», що вимірює рівень здивування або збентеження, який відчуває модель генеративної мови під час спроби передбачити наступне слово в реченні. Якщо програма може легко передбачити наступне слово, то цей показник автоматично стає низьким.

Адже такі ШІ, як ChatGPT, можуть створювати текст із низьким рівнем емоційності. І через те, що автори, які не є носіями використовують загальні слова і конструкції, їхній контент можна помилково прийняти за штучний.

Автори дослідження наголосили на серйозних наслідках детекторів GPT для не носіїв і наголосили на необхідності розв'язання цих проблем, щоб запобігти дискримінаційним ситуаціям.

Читайте також: Google дозволив собі збирати будь-які дані для навчання штучного інтелекту. Що це означає

«Наслідки детекторів GPT для не носіїв англійської є серйозними, і ми повинні продумати їх, щоб уникнути ситуацій дискримінації. У сфері освіти, яка є, мабуть, найважливішим ринком для детекторів GPT, іноземні студенти несуть більше ризиків хибних звинувачень у списуванні, що може бути шкідливим для академічної кар’єри та психологічного стану студента», — додали дослідники.

Яна Оттербахер з Кіпрського центру алгоритмічної прозорості Відкритого університету Кіпру має свою думку щодо питання з ШІ. Вона зазначила, що замість того, щоб боротися зі ШІ за допомогою додаткового ШІ, люди повинні розвивати академічну культуру, яка сприяє використанню генеративного ШІ у творчому та етичному напрямках. ChatGPT постійно збирає дані від громадськості та вчиться догоджати своїм користувачам. Тому зрештою, бот навчиться перехитрити будь-який детектор.

Штучний інтелект

Освіта

Суспільство

Швидкий доступ до новин та ексклюзивних матеріалів – у нашому каналі в Telegram.

Програми для виявлення ШІ дискримінують контент не англомовних користувачів

Як проводилося дослідження

Справа в«емоційності» тексту

Membrana Video

Останні публікації

Membrana Media бере участь у престижному конкурсі IAB MIXX Awards

Membrana Media допомагає дітям освоювати IT-професії

Membrana Media взяла участь у засіданні комітету паблішерів IAB Ukraine. Галузь чекає на зміни

Відео як бенчмарк: чому Headline Video повністю змінює формат подачі новин

Вiдео публікації

Маркетологи Burger King щосили намагаються пересадити людей на рослинні котлети

Концерн Lego випустив конструктор зі шрифтом Брайля для дітей із порушеннями зору

У Лондоні автомати Sprite роздають безкоштовні напої людям з поганим настроєм

Читайте також

Лайфхак для редакторів: як Headline Video допомагає виданням робити інфоприводи яскравішими

Відео в заголовках: як видавцям зацікавити читачів та збільшити аудиторію ЗМІ

Як видавцю вибрати партнера для монетизації відеоконтенту та чи можна обійтися без нього

Благодійний бранч Святого Миколая: Membrana Media отримала відзнаку БФ «Благомай» за внесок в IT-навчання дітей

Hosted Video — нова грань монетизації власного відеоконтенту для видавців

Воркшоп Membrana Media відбувся у Стамбулі: на видавців чекає багато хороших новин

Відео в заголовках: як видавцям зацікавити читачів та збільшити аудиторію ЗМІ

Як видавцю вибрати партнера для монетизації відеоконтенту та чи можна обійтися без нього

Благодійний бранч Святого Миколая: Membrana Media отримала відзнаку БФ «Благомай» за внесок в IT-навчання дітей

Hosted Video — нова грань монетизації власного відеоконтенту для видавців

Hosted Video — нова грань монетизації власного відеоконтенту для видавців

Воркшоп Membrana Media відбувся у Стамбулі: на видавців чекає багато хороших новин

Реновація комунікацій: Membrana Media розвиває власну експертизу у галузі PR

Дотримання GDPR як конкурентна перевага: що очікує українських видавців у 2024 році та як не втратити статки через обробку даних. Поради Membrana Media

Що таке Embed Video, та як цей формат дозволяє видавцям заробляти більше на In-Stream рекламі

IAB Tech Lab вносить ясність у категорію відеореклами: що змінится для видавців

Membrana Advertising Solution

Membrana Media візьме участь у заході «PR-Марафон: реновація комунікацій»

Що відбувається на ринку праці у сфері IT: HR-Generalist Membrana Media розповідає DOU.UA про сучасні тренди рекрутингу

Google Publisher Stories: шлях Membrana Media серед надихаючих історій для видавців

Відео в заголовках: як видавцям зацікавити читачів та збільшити аудиторію ЗМІ

Як видавцю вибрати партнера для монетизації відеоконтенту та чи можна обійтися без нього

Благодійний бранч Святого Миколая: Membrana Media отримала відзнаку БФ «Благомай» за внесок в IT-навчання дітей

Hosted Video — нова грань монетизації власного відеоконтенту для видавців

Membrana Advertising Solution

Воркшоп Membrana Media відбувся у Стамбулі: на видавців чекає багато хороших новин

Реновація комунікацій: Membrana Media розвиває власну експертизу у галузі PR

Дотримання GDPR як конкурентна перевага: що очікує українських видавців у 2024 році та як не втратити статки через обробку даних. Поради Membrana Media

Що таке Embed Video, та як цей формат дозволяє видавцям заробляти більше на In-Stream рекламі

IAB Tech Lab вносить ясність у категорію відеореклами: що змінится для видавців

Membrana Media візьме участь у заході «PR-Марафон: реновація комунікацій»

Що відбувається на ринку праці у сфері IT: HR-Generalist Membrana Media розповідає DOU.UA про сучасні тренди рекрутингу

Google Publisher Stories: шлях Membrana Media серед надихаючих історій для видавців

Іспанський медіаринок: рекламні потужності та перспективи розвитку. Досвід Membrana Media

Нова ера цифрового маркетингу: головні інсайти з масштабної конференції DMEXCO-2023 у Кельні

Membrana Media News стає корпоративним блогом: що це означає для наших читачів

Джордж Р. Р. Мартін та інші автори подають до суду на OpenAI за порушення авторських прав

Штучний інтелект тепер може перекладати мову курок: що це означає

Як звук впливає на ефективність реклами: результати дослідження

Google звинувачують у критичній помилці навігаційної системи, яка призвела до смертельної ДТП

«Нестримні-4»: як кіностудії грають на вайбах міленіалів та тримають глядача «на голці» бойовиків

Airbnb обходить місцеві обмеження оренди завдяки маркетингу. Допомагає влучна реклама