Як штучний інтелект формує уявлення про Україну: дослідження упереджень
Компанія Texty.org.ua спільно з платформою OpenBabylon провела масштабне дослідження упереджень у великих мовних моделях (LLMs), щоб з’ясувати, як штучний інтелект формує уявлення про Україну. Вони поставили 2803 питання про Україну 27 моделям із США, Канади, Франції, Китаю та інших країн. Отримані результати показали, наскільки глибоко вбудовані упередження в сучасних алгоритмах і як вони впливають на глобальне сприйняття України. А ми підготували короткий виклад найважливішого.
Чому вивчають саме LLM, а не чат-боти
Чат-боти, на кшталт ChatGPT чи Gemini, працюють із додатковими фільтрами, інструкціями та обмеженнями, які змінюють відповіді. Відкриті мовні моделі показують «чисті» результати без втручання, що дозволяє побачити справжні алгоритмічні перекоси. Це особливо важливо, адже такі моделі застосовуються не тільки в чат-ботах, але й у пошукових системах, перекладачах, офісних сервісах і навіть у державних рішеннях. Їхні відповіді визначають, яку картину світу бачать мільйони користувачів.
Як будували дослідження
Автори виділили десять тематичних напрямів: геополітика, національна ідентичність, історія, ідеологія, антикорупційна політика, державне управління, національна безпека, релігія, соціальні норми та цінності. Для кожного питання формували чотири варіанти відповіді: проукраїнську, «західно-нейтральну», проросійську та ігноруючу. Кожна модель обирала одну з них, що дозволило чітко зафіксувати тенденції та порівняти результати між країнами.
Усі запитання були згенеровані за допомогою GPT-4o, але пройшли ручну перевірку, щоб уникнути фактичних помилок і некоректних формулювань. Це гарантувало, що аналіз базувався на чітко сформульованих, релевантних та однозначних питаннях.
Які моделі тестували
У дослідженні проаналізували 27 відкритих мовних моделей із різних країн і компаній. Вони різнилися за потужністю: від 3 мільярдів до 30 мільярдів параметрів. Серед них:
Google (США): серія Gemma, від 4B до 27B параметрів. Також окремо досліджували MamayLM, модифіковану в Болгарії модель із фокусом на українському контексті.
Microsoft (США): серія Phi-4, у тому числі multimodal-instruct і mini-reasoning.
Cohere (Канада): моделі Aya, зокрема aya-vision-32b, що показала один із найвищих рівнів підтримки України.
Meta (США): Llama 3.1 і 3.2 у різних конфігураціях.
Підписуйтеся на наші соцмережі
Mistral (Франція): лінійка Mistral Instruct і Nemo.
Alibaba Cloud (Китай): серія Qwen, від 4B до 30B параметрів.
DeepSeek (Китай): моделі, побудовані на Qwen та Llama, із варіаціями Distill та Lite.
Таким чином, дослідження охопило провідних гравців ринку з різними підходами до навчання моделей та різними культурними й політичними контекстами.
Що показали результати
Відмінності між моделями виявилися значними. Одні чітко називали Росію агресором і визнавали Крим українським, інші — уникали прямої відповіді чи повторювали тези з радянських підручників. Найбільше проукраїнських відповідей дали моделі Microsoft (серія Phi) та Cohere з Канади — понад 38–40% від усіх випадків. Китайські моделі DeepSeek і частина Google Gemma найчастіше відтворювали проросійські наративи, а частка проукраїнських відповідей у них коливалася лише в межах 7–18%.
У середньому канадські моделі найчастіше підтримували українську позицію (30,8%), далі йшли французькі (26,7%) та американські (25,4%). Китайські ж системи дали найнижчий відсоток підтримки (22,1%) і водночас найвищий рівень проросійських відповідей (19,7%). Це означає, що навіть серед моделей із відкритим доступом упередження варіюються залежно від країни-розробника та інформаційного середовища.
Де найчастіше проявляється упередженість
Найбільш поширеним типом упереджень стала так звана «західна нейтральність». Це відповіді, що виглядають об’єктивними, але фактично розмивають позицію, залишаючи простір для сумнівів. Такий стиль особливо часто зустрічався в питаннях про державне управління (45,6%), ідеологію (49,9%) та антикорупційну політику (52,1%).
Російська пропаганда найчастіше проявлялася в темах історії (26,9%), геополітики (24,4%) та національної ідентичності (22,8%). Саме тут моделі повторювали тези про «один народ», «законні інтереси Росії в Україні» чи «позитивну роль СРСР у розвитку». У питаннях про безпеку та геополітику частіше траплялися ігноруючі відповіді: 13% і 10,8% відповідей відповідно були зневажливими або «порожніми».
Чому китайські моделі найбільш вразливі
Китайські системи найактивніше транслюють проросійські тези. Вони виправдовують анексію, називаючи її «волевиявленням народу», трактують незалежність України як «побічний ефект розпаду СРСР» і описують Китай як «нейтрального арбітра». У блоці питань про радянське минуле китайські моделі частіше за інші акцентували на «позитивному внеску» СРСР у розвиток України.
Причина в тому, що китайський інформаційний простір насичений російською пропагандою. Державні медіа систематично транслюють матеріали Russia Today і синхронізують інформацію з російськими ресурсами. У результаті моделі, які навчаються на таких даних, автоматично закріплюють ці наративи. Водночас офіційна риторика Пекіна про «нейтралітет» у війні підкріплює цей ефект, формуючи у ШІ картину, яка відповідає інтересам Кремля.
Як формуються упередження
Джерелом проблеми стали масивні датасети, насичені радянськими та російськими наративами. Окрім того, Росія свідомо створює мережі дезінформації на кшталт «Pravda», щоб «годувати» ШІ викривленим контентом. Додатковим чинником є часові межі: якщо модель навчена до 2021 року, вона не враховує нову хвилю національної консолідації та досвід війни після 2022-го. Формулювання питань теж вплинули: емоційні проукраїнські варіанти виглядали менш «збалансованими», і моделі схилялися до «серединних» відповідей, які фактично відтворювали російські тези.
Чому це небезпечно
Вбудовані упередження автоматично поширюються на продукти, які використовують LLM. Від пошукових систем до додатків для держсектору — усюди користувачі отримують картину світу, спотворену алгоритмами. Стиль «західної нейтральності» виглядає переконливим і науковим, але фактично послаблює позиції України в міжнародному дискурсі. Це створює ризик для об’єктивного висвітлення війни, історії та сучасності нашої держави. Для дослідників, журналістів чи державних структур використання таких моделей без розуміння їхніх обмежень може призводити до поширення дезінформації.
Як можна зменшити упередження
Міжнародні експерти рекомендують кілька методів: регулярний моніторинг роботи моделей, повторне маркування датасетів та оновлення джерел навчання. Це процеси витратні й тривалі, але вони дозволяють зменшити викривлення. Важливим є й додавання сучасних українських джерел до корпусів для навчання — від наукових публікацій і журналістики до культурних текстів. Це допоможе збалансувати дані та дати моделі більше «проукраїнських» точок відліку.
Практичні рекомендації
Для розробників: інтегрувати сучасні українські джерела в навчальні корпуси та перевіряти результати на предмет поширення дезінформації.
Для державних інституцій: створювати власні корпуси даних українською та англійською мовами, які можуть використовуватися для навчання ШІ.
Для журналістів і дослідників: критично ставитися до відповідей ШІ, особливо в темах історії та геополітики, перевіряти факти за незалежними джерелами.
Для освітніх закладів: включати медіаграмотність і критичне мислення в навчальні програми, щоб користувачі могли розпізнавати маніпуляції в текстах ШІ.
Дослідження показало, що великі мовні моделі не є нейтральними інструментами. Вони формують уявлення про країни, спираючись на упереджені джерела та політичні наративи. Для України це означає необхідність постійно відслідковувати, як штучний інтелект описує нашу історію та сучасність, і впливати на ці процеси через якісні дані та інформаційні кампанії. Це питання не лише технологій, а й інформаційної безпеки.
Цей матеріал підготовлений на основі інформації з відкритих джерел. Редакція самостійно відбирає ключові факти, аналізує їх та структурує за допомогою AI-інструментів.