LLM як афазія Верніке: що спільного в AI та розладах мозку

6 хвилин читання

Видання Neuroscience News опублікувало матеріал про те, що сучасні мовні моделі, зокрема ChatGPT, демонструють подібну до афазії Верніке поведінку. Це відкриття спричинило хвилю нових питань про природу мислення, мовлення та інформаційної обробки в мозку і в AI. Ми підготували виклад ключових ідей та пояснюємо, чому це дослідження може вплинути на розвиток як нейронауки, так і штучного інтелекту.

LLM як афазія Верніке: що спільного в AI та розладах мозку. Image: freepik.com

Коли штучний інтелект «говорить», як мозок із мовним розладом

На перший погляд, ChatGPT, Claude, Llama чи інші великі мовні моделі (LLM) створюють враження ідеально натренованого мовця. Вони пишуть грамотно, стилістично влучно, з правильною побудовою речень. Але якщо уважніше придивитися до змісту, особливо коли моделі працюють поза межами звичних тем, помітно: іноді відповіді здаються осмисленими лише на поверхневому рівні. Мовна оболонка є, а сенс — розмитий, хибний або взагалі відсутній.

Читайте також: Вік, у якому людина вперше вступає в статеві стосунки, може бути пов’язаний зі станом здоров’я та якістю життя у старшому віці. Такого висновку дійшли дослідники з Китаю після аналізу великої генетичної бази даних. Про це пише New York Post із посиланням на результати нового наукового дослідження.

Це явище відоме як «галюцинація» мовних моделей — вони впевнено вигадують дані, маніпулюють фактами чи створюють абсурдні твердження. На диво, подібну поведінку демонструють і люди з афазією Верніке — неврологічним розладом, що порушує розуміння мови. Пацієнти з таким діагнозом можуть говорити швидко й багато, без помітних граматичних помилок, але сенс сказаного часто втрачається.

Це схожість настільки вразила вчених з Токійського університету, що вони вирішили перевірити: чи не свідчить це про глибші спільні механізми?

Як вивчають динаміку мозку й мовних моделей

Щоб зрозуміти внутрішні процеси обробки інформації, дослідники використали аналіз енергетичних ландшафтів — метод із фізики складних систем, адаптований для візуалізації змін у станах системи. Такий підхід дозволяє уявити активність мозку або LLM як м’яч, який котиться по рельєфній поверхні. Глибокі западини означають стабільні стани, а мілкі чи нестабільні — хаотичність, характерну для розладів.

Підписуйтеся на наші соцмережі

Команда дослідників порівняла динаміку активності LLM (серед яких GPT-2, ALBERT, Llama-3.1 та японський варіант Llama) з функціональною активністю мозку людей з афазією. Для цього вони змоделювали, як мовна модель реагує на вхідні запити, і зіставили цю реакцію зі схемами мозкової активності пацієнтів з різними типами афазій.

Виявилось, що деякі архітектури LLM демонструють дуже подібну до хворого мозку поведінку: нестабільні переходи між станами, імпульсивна реакція на нові сигнали, утрата цілісності змісту при збереженні граматичної оболонки.

Що таке афазія Верніке і чим вона небезпечна

Афазія Верніке — це порушення, що виникає через ураження зони Верніке в головному мозку. Ця ділянка розташована в лівій скроневій частці та відповідає за розуміння мови. Хворі з цим розладом здатні вільно говорити, іноді навіть занадто багатослівно, однак слова втрачають логіку: в реченнях можуть з’являтися вигадані слова, повтори, непослідовність і смисловий хаос.

У реальному житті це створює враження, ніби людина щось «вигадує» або не чує себе, хоча фізично вона не втрачає здатності говорити. Саме ця характеристика виявилась подібною до поведінки LLM, які, маючи велику мовну потужність, не завжди здатні зберігати логіку чи відповідати достовірно.

Що це означає для штучного інтелекту

Висновки дослідження відкривають кілька нових напрямів для інженерів AI. Якщо мовна модель функціонує подібно до хворого мозку, то це означає, що архітектура або навчальні механізми потребують змін. Першочерговим завданням є створення стійких енергетичних «западин» — стабільних внутрішніх станів, що дозволяють моделі не лише генерувати форму, а й зберігати логіку, фактологію, контекст.

Це також дозволяє AI-розробникам дивитись на мовні моделі як на когнітивні системи, де важливо не лише накопичення параметрів, а і структура, взаємодія між вузлами, імовірнісна поведінка системи.

Крім того, ці знання можуть допомогти в діагностиці самих LLM. Якщо певна модель виявляє схильність до «галюцинацій», це може бути вказівкою на її внутрішню нестабільність або невдалий навчальний набір. Таким чином, модель можна «лікувати» — змінювати архітектуру, переобучувати, коригувати сигнальні ланцюги.

Імплікації для медицини та когнітивної науки

Результати цього дослідження мають також і прикладне значення для медицини. Якщо вчені змогли змоделювати патерни афазії через математичні параметри мовних моделей, то вони можуть використати ті ж методи для діагностики реальних пацієнтів. Порівняння мозкової активності з аналогічними енергетичними ландшафтами дозволить створювати точніші діагностичні моделі, розпізнавати ранні прояви афазії та краще оцінювати ефективність реабілітаційних програм.

Також відкривається можливість створення персоналізованих систем підтримки мовлення. Наприклад, мовна модель, адаптована під конкретну афатичну динаміку, може допомогти пацієнтам краще комунікувати або заповнювати смислові прогалини в їхній мові.

Спільне майбутнє AI та нейронауки

Це дослідження є прикладом міждисциплінарного прориву, коли технології штучного інтелекту не лише запозичують підходи з нейронауки, а й повертають користь назад — у вигляді нових моделей, аналогій, методів вивчення мозку. AI перестає бути лише інструментом і дедалі більше схожий на дзеркало для вивчення когнітивних процесів.

Чим більше ми дізнаємося про те, як саме працюють LLM, тим краще можемо зрозуміти людський мозок — і навпаки. І якщо вже сьогодні ми бачимо, що мовна модель може демонструвати поведінку, подібну до афазії, то, можливо, в майбутньому штучний інтелект допоможе нам розкрити глибинні механізми свідомості, мовлення і мислення.

Цей матеріал підготовлений на основі інформації з відкритих джерел. Редакція самостійно відбирає ключові факти, аналізує їх та структурує за допомогою AI-інструментів.