Натискаючи “Прийняти всі куки”, від підтверджуєте свою згоду на зберігання файлів cookie на вашому пристрої для покращення навігації сайту, аналізу використання сайту та допомоги в наших маркетингових зусиллях. Перегляньте нашу Політику конфіденційності для отримання додаткової інформації.
Налаштування файлів cookie

Що таке «дрейф штучного інтелекту» і чому він робить ChatGPT дурнішим

Експерти зі штучного інтелекту запевняють, що незалежно від того як часто ви користуєтесь ChatGPT і який досвід від нього отримуєте, він перестав розвиватись. Навпаки, ChatGPT стає все дурнішим.

Це явище викликає особливе збентеження, оскільки генеративні моделі ШІ використовують дані користувача для постійного навчання, що повинно зробити їх розумнішими, оскільки з часом вони накопичують більше записів користувачів.

«Дрейф ШІ» – це стан, коли великі мовні моделі (LLM) поводяться несподівано або непередбачуваним чином, відхиляється від початкових параметрів. Це може статися тому, що спроби покращити частини складних моделей ШІ спричиняють погіршення роботи інших частин

Дослідники з Університету Каліфорнії в Берклі та Стенфордського університету провели дослідження, щоб оцінити дрейфи та вивчити популярні моделі ChatGPT: версії 3.5 і 4.

Дослідження порівнювало здатність обох версій можливість розв’язувати математичні задачі, відповідати на делікатні питання, відповідати на опитування громадської думки, відповідати на багатозначні наукомісткі запитання, виконувати кодування, складати іспити на медичну ліцензію США та виконувати завдання на візуальне міркування в березні та червні.

Читайте також: Як Telegram загрожує Україні: співзасновник Petcube Ярослав Ажнюк розказав про ризики

Результати дослідження продемонстрували, що березнева версія GPT-4 перевершила червневу версію в багатьох випадках. GPT-4 гірше вирішував завдання під час створення коду, відповідей на запитання медичного обстеження та опитувань громадської думки. Усі ці випадки можна віднести до явища дрейфу.

Але, попри погіршення ШІ, також були деякі випадки покращення як у GPT-4, так і в GPT-3.5. У результаті дослідники закликають користувачів продовжувати використовувати LLM, але бути обережними при їх використанні та постійно їх оцінювати.

Telegram logo

Швидкий доступ до новин та ексклюзивних матеріалів – у нашому каналі в Telegram.

Читайте також