Соціальні маркери, які видають штучний інтелект у розмові

5 хвилин читання

Сучасні великі мовні моделі, такі як ChatGPT, Copilot та Perplexity, демонструють вражаючу здатність генерувати текст і вести чат-діалоги. Вони допомагають у вирішенні завдань і слугують для розваги. Однак, незважаючи на бездоганну граматику та логіку, усе ще залишається відчуття, що в їхніх розмовах чогось бракує. Журнал Neuroscience News розповів про результати наукового дослідження, яке дає чітке пояснення цієї проблеми. Ми підготували виклад найцікавішого.

Соціальні маркери, які видають штучний інтелект у розмові. Image: freepik.com

Надмірне наслідування: феномен «перебільшеного узгодження»

Коли люди спілкуються, між ними відбувається певна кількість наслідування: ми трохи адаптуємо свої слова та хід розмови під співрозмовника. Але це наслідування зазвичай є досить тонким та ледь помітним.

Читайте також: Компанія Anthropic тимчасово зупинила роботу своїх нових моделей штучного інтелекту Claude Fable 5 та Mythos 5 після вимог американської влади, яка висловила занепокоєння щодо їхніх можливостей у сфері кібербезпеки.

Дослідження, проведене під керівництвом Еріка Майора з Університету Базеля та за участю доцента Лукаса Біетті з Норвезького університету природничих та технічних наук (NTNU) та Адріана Бангертера з Університету Невшателя, виявило, що великі мовні моделі надто прагнуть до імітації. Це явище отримало назву «перебільшене узгодження» (exaggerated alignment). За словами Біетті, саме це надмірне наслідування є тим, що люди інстинктивно впізнають як неприродне і штучне. Аналіз транскриптів, згенерованих ChatGPT-4, Claude Sonnet 3.5, Vicuna та Wayfarer, показав, що таке узгодження в діалогах ШІ є перебільшеним, і, більш того, воно зростає в міру розвитку розмови.

Проблема з маркерами дискурсу: чому «ну» і «типу» видають ШІ

Підписуйтеся на наші соцмережі

Сценарії поганих фільмів часто мають неприродні діалоги, оскільки сценаристи забувають, що розмова складається не лише з необхідних за змістом слів. У реальному повсякденному спілкуванні ми постійно використовуємо невеликі слова, які називаються маркерами дискурсу (discourse markers). До них належать такі слова, як «отже» (so), «ну» (well), «типу» (like) та «так чи інакше» (anyway).

Ці маркери виконують важливу соціальну функцію: вони можуть сигналізувати про інтерес, ставлення, належність або допомагають структурувати розмову. Дослідження показало, що великі мовні моделі досі мають значні труднощі з використанням цих слів. Як пояснює Лукас Біетті, LLMs використовують ці малі слова інакше, а часто і просто неправильно. Ця помилка у застосуванні соціальних нюансів допомагає людям викрити діалог як нелюдський.

Невміння починати і завершувати розмову

Ще один критичний аспект, у якому ШІ не справляється, – це природні переходи, а саме: початок і кінець діалогу.

Коли люди починають розмову, вони рідко переходять прямо до суті. Натомість ми починаємо з «малої розмови» (small talk), використовуючи такі фрази як «привіт», «як справи?» або «о, несподівано тебе тут бачити». Цей перехід від вступу до основної частини відбувається у людини майже автоматично і без явного оголошення. Лукас Біетті зазначає, що як цей вступ, так і сам перехід до нової фази розмови є надто складними для імітації великими мовними моделями.

Те саме стосується і завершення. Ми зазвичай не обриваємо розмову одразу після передачі інформації. Замість цього ми використовуємо завершальні фрази, як-от «гаразд, тоді», «окей», «зідзвонимося пізніше» або «до зустрічі». Великі мовні моделі не можуть повноцінно відтворити і цю частину соціальної взаємодії.

Чи зможе ШІ зазвучати по-людськи у майбутньому?

Усі ці недоліки разом узяті свідчать про те, що сьогоднішні LLMs ще не здатні достатньо добре імітувати людей, щоб послідовно нас обманювати.

Хоча розвиток технологій відбувається стрімко, і моделі, ймовірно, скоро зможуть це робити. Проте, науковці пропонують більш обережний висновок. Поліпшення, швидше за все, звузять розрив між людськими та штучними розмовами, але ключові відмінності, ймовірно, залишаться. Дослідники припускають, що розрив може бути зумовлений фундаментальними відмінностями між розмовною мовою та чат-форматом, на якому навчаються LLMs. Ключові соціальні тонкощі, такі як емпатія, правильне відчуття часу та соціальний намір, можуть назавжди відрізняти людину від машини. Поки що моделі залишаються недостатньо схожими на людину, щоб обманювати нас щоразу.

Глосарій ключових понять
  • Великі мовні моделі (LLMs): Алгоритми глибокого навчання (як-от ChatGPT, Claude), які використовують величезні масиви даних для генерації тексту та імітації людської мови.
  • Маркери дискурсу (Discourse Markers): Невеликі слова або фрази (well, so, like), які не є критично важливими для змісту речення, але слугують для структурування розмови та передачі соціальних сигналів, ставлення чи інтересу.
  • Перебільшене узгодження (Exaggerated Alignment): Феномен, притаманний діалогам ШІ, коли модель надмірно імітує стиль, лексику або синтаксис свого співрозмовника, роблячи імітацію інтенсивною і неприродною для людського вуха.
  • Корпус Switchboard (SB): Великий набір транскриптів реальних розмов по телефону, який використовувався дослідниками як еталон природного людського спілкування для порівняння з діалогами, згенерованими ШІ.

Цей матеріал підготовлений на основі інформації з відкритих джерел. Редакція самостійно відбирає ключові факти, аналізує їх та структурує за допомогою AI-інструментів.