Мовний відкат: міф чи реальність? Дослідження newage.

15 хвилин читання

newage. — українська digital-агенція та одна з провідних аналітичних команд у сфері медійної реклами. Ми допомагаємо брендам приймати маркетингові рішення на основі даних та працюємо з клієнтами в Україні й на міжнародних ринках. Серед наших клієнтів — Rozetka, Fozzy Group, Dyson, Viber та OLX.

Після початку повномасштабної війни мовний ландшафт українського інтернету почав помітно трансформуватися. Українська мова дедалі частіше ставала основною мовою спілкування в соціальних мережах, на YouTube, у Telegram-каналах та на інших цифрових майданчиках.

Рік тому ми вже аналізували ці зміни, використовуючи відкриті дані та алгоритми машинного навчання. Тоді результати свідчили про стале зростання частки української мови в онлайн-комунікації. Однак будь-які суспільні зміни потребують повторної перевірки, особливо коли йдеться про довгострокові тенденції.

Саме тому ми вирішили провести нову хвилю дослідження та суттєво розширити масштаб аналізу.

Читайте також: Новий продукт автоматизує аналіз семантики, конкурентів та аудит сайту на основі 13 років даних Serpstat. Перші користувачі скорочують час рутинних SEO-задач у 4–6 разів.

Нашою метою було не просто зафіксувати окремі цифри. Ми хотіли зрозуміти головне: як сьогодні виглядає мовна карта українського інтернету, де українська вже стала безумовною нормою, а де боротьба за неї все ще триває.

Методологія дослідження

У межах нового етапу дослідження ми значно збільшили масштаб аналізу як за кількістю даних, так і за різноманітністю джерел. Загалом було опрацьовано понад 2 мільйони користувацьких коментарів і повідомлень із різних сегментів українського онлайн-простору.

Варто зазначити, що предметом дослідження стала не мова контенту, який створюють автори, медіа чи адміністратори спільнот. Ми аналізували саме мову аудиторії — тобто те, якою мовою користувачі коментують, дискутують та взаємодіють між собою.

Звісно, такий підхід не відображає мовну ситуацію в офлайн-комунікації. Водночас коментарі залишаються одним із найбільших доступних масивів природної цифрової взаємодії. До того ж вибірка охоплює різні типи контенту, регіони та аудиторні спільноти, що дозволяє отримати доволі репрезентативний зріз мовної поведінки українських користувачів.

До вибірки увійшли:

  • YouTube-канали різних тематик — близько 1,5 млн проаналізованих коментарів;
  • Telegram-канали та публічні обговорення — понад 200 тис. коментарів;
  • Twitch-стріми та стрімінгові спільноти — близько 150 тис. повідомлень;
  • регіональні Telegram-канали з різних міст України — понад 300 тис. коментарів.

Для обробки масиву даних ми використали відкриті джерела інформації, власні інструменти збору даних та алгоритми автоматизованого аналізу. На етапі класифікації коментарів застосовувалися моделі визначення мови, зокрема LangDetect, які дозволили розподілити всі повідомлення на три основні категорії:

  • українська мова;
  • російська мова;
  • інші мови, змішані конструкції або повідомлення, що складалися переважно з емодзі та символів.

Важливо розуміти: цифровий простір не є повним дзеркалом країни.

Онлайн-комунікація має свої алгоритми, інформаційні бульбашки та специфіку окремих платформ. Водночас саме інтернет сьогодні дуже точно фіксує напрям суспільних змін, особливо коли йдеться про щоденні мовні звички мільйонів людей.

YouTube: українська стала мовою масового контенту

Серед усіх платформ саме YouTube дає змогу найкраще простежити мовні зміни, що відбуваються в українському цифровому середовищі. Велика кількість контенту, різноманіття тематик і активні дискусії в коментарях дозволяють побачити не лише мовну політику авторів, а й реальну мовну поведінку аудиторії.

Результати аналізу свідчать, що українська мова сьогодні домінує в більшості досліджених сегментів платформи. Проте рівень її поширення суттєво відрізняється залежно від тематики контенту та складу аудиторії.

В окремих нішах українська фактично стала основною мовою спілкування користувачів, тоді як в інших ще зберігається помітна частка російськомовної комунікації. Це дозволяє розглядати YouTube не лише як відеоплатформу, а й як своєрідний індикатор того, як мовна трансформація відбувається в різних аудиторних середовищах.

Розважальний YouTube

Саме розважальний сегмент традиційно вважався одним із найскладніших для українізації. Однак сьогодні ситуація виглядає інакше. Аналіз коментарів під популярними розважальними відео показує, що українська мова вже домінує в спілкуванні аудиторії на більшості великих каналів.

Серед найвищих показників частки україномовних коментарів:

  • Підпільний стендап (85%),
  • SEREDA (82%), 
  • Леви на джипі (81%), 
  • Фелікс Редька (76%) 
  • та Дурнєв (76%).

Навіть у каналах із більш різнорідною аудиторією українська часто вже переважає або наближається до домінування.

Водночас окремі великі entertainment-проєкти все ще залишаються змішаними за мовною структурою. Наприклад, у “95 кварталі” частка україномовних коментарів становить 52%, що демонструє майже рівний поділ між українською та іншими мовами.

Освітній та культурний YouTube

Окремо варто виділити освітній і культурний сегмент українського YouTube. Саме тут україномовний контент за останні роки не просто виріс, а фактично сформував повноцінну цифрову екосистему зі стабільною аудиторією та високим рівнем залучення.

Канали на кшталт Geek Journal (86%), Історія без міфів (86%), Клятий раціоналіст (90%), Загін кіноманів (87%) та Bezodnya Music (86%) демонструють дуже високі показники україномовної взаємодії в коментарях. Це особливо важливо, адже ще кілька років тому значна частина аудиторії культурного та оглядового контенту в українському YouTube перебувала під сильним впливом російськомовного інформаційного простору.

Підписуйтеся на наші соцмережі

Сьогодні ж ситуація змінилася. Українською мовою активно обговорюють фільми, музику, історію, попкультуру, науку та суспільні теми.

Політичний та суспільний сегмент

Політичний і суспільний YouTube залишається більш турбулентним середовищем. На відміну від розважального чи культурного контенту, тут значно сильніше відчувається вплив інформаційних атак, бот-активності та зовнішнього трафіку.

Наприклад, на каналах Стерненка частка україномовних коментарів становить 63%, у Євгена Карася — 72%, у Сергія Ягодзінського — 55%, а в Олексія Гончаренка — 47%.

Такі результати не завжди означають реальну мовну структуру аудиторії. Політичний контент значно частіше потрапляє в поле уваги бот-мереж, російськомовних користувачів та аудиторії поза межами України.

Попри це, навіть у найбільш конфліктних і поляризованих сегментах українська мова вже утримує сильні позиції й у багатьох випадках продовжує переважати. Це свідчить про те, що українізація цифрового простору відбувається не лише в “комфортних” сегментах контенту, а й у середовищах із високою інформаційною турбулентністю.

Геймерський YouTube

Сьогодні українська мова вже впевнено закріплюється і в gaming-середовищі. Наприклад, XGTV UA має 77% україномовних коментарів, Nika Karuso — 72%, Саня Майнкрафт — 70%, а OLDboi — одразу 86%.

Ще кілька років тому такі показники для геймерського сегменту виглядали б майже нереалістично. Але зараз українська дедалі частіше стає мовою не лише локальних gaming-спільнот, а й масового контенту про ігри, кіберспорт та стрімінг.

Twitch: молодь, стрімінг і найскладніше мовне середовище

Однією з нових платформ у межах дослідження став Twitch — середовище, яке раніше не входило до нашого аналізу. Саме тому цей напрям став одним із найцікавіших і водночас найскладніших з точки зору збору даних.

На відміну від більшості соціальних платформ, Twitch працює за логікою живого спілкування навколо стрімів, що значно ускладнює систематичний збір та обробку великих масивів повідомлень. Через ці технічні особливості платформа рідко потрапляє до масштабних досліджень мовної поведінки користувачів.

Для нас було важливо заповнити цю прогалину. Twitch уже давно став одним із ключових майданчиків для молодої аудиторії, де формуються спільноти навколо ігор, кіберспорту, стрімінгу та розважального контенту. Тому без аналізу цього середовища картина українського цифрового простору залишалася б неповною.

Для цього проєкту команда newage. розробила окремий підхід до збору та аналізу даних Twitch, що дозволило вперше включити стрімінгове середовище до загальної картини українського інтернету та отримати дані про мовні звички аудиторії цієї платформи.

І результати виявилися дуже показовими.

Отримані результати виявилися особливо цікавими через історичний контекст платформи. Протягом багатьох років стрімінгова та геймерська екосистема розвивалася переважно навколо російськомовного контенту, а значна частина українських авторів орієнтувалася саме на цю аудиторію. Саме тому Twitch сьогодні є одним із найкращих майданчиків для спостереження за тим, як мовні звички змінюються в середовищі, де російська мова тривалий час мала домінуючі позиції.

Дані показують, що Twitch усе ще залишається найбільш змішаною платформою серед усіх, які ми аналізували. Водночас навіть тут українська активно зростає і в частини стрімерів уже переважає.

Наприклад, у vgostiua, i_reidman та Skevich_ частка україномовних повідомлень уже становить 53%, тоді як російськомовних — лише 10–13%. У Leb1ga українська також залишається найбільшою мовною категорією: 49% повідомлень написані українською проти 22% російською, а решту становлять інші мови та повідомлення, які не вдалося однозначно класифікувати.

Водночас є й канали, де російська мова все ще домінує. Найяскравіший приклад — reznikbtw, де частка російськомовних повідомлень сягає 60%, тоді як українською написано лише 12% повідомлень.

Окремо варто звернути увагу й на велику частку категорії “інше” — англійської, суржику, емодзі, сленгу та змішаних конструкцій. Для Twitch це абсолютно природно: стрімінгова культура значно менш формалізована, ніж інші платформи, а мова спілкування часто формується в режимі реального часу.

Попри це, головний тренд очевидний: навіть у середовищі, яке довгий час залишалося одним із найбільш русифікованих, українська мова поступово стає дедалі помітнішою частиною цифрової культури.

Telegram і бот-ефект

Telegram залишається однією з найвпливовіших платформ українського інформаційного простору — особливо в новинному, політичному та військовому сегментах. Саме тому аналіз мовної ситуації тут є особливо важливим: Telegram не лише відображає суспільні настрої, а й часто стає полем інформаційного впливу та цифрових атак.

Попри це, українська мова сьогодні впевнено домінує і в більшості великих Telegram-каналів.

Наприклад:

  • у Forbes Ukraine частка україномовних коментарів зросла з 83% у нашому попередньому дослідженні до 90%. 
  • в AIN.UA показник виріс із 92% до 97%, що фактично робить українську абсолютною мовою комунікації всередині спільноти.

Схожу динаміку демонструє і канал Стерненка: якщо минулого разу україномовних коментарів було 83%, то тепер — уже 85%.

Водночас окремі канали показують іншу тенденцію. Наприклад, у DeepState частка української знизилась із 73% до 69%. Але важливо розуміти контекст: військові та політичні Telegram-канали значно частіше стають об’єктом зовнішньої бот-активності, інформаційних атак та напливу російськомовного трафіку.

Саме тому Telegram — одна з небагатьох платформ, де мовна статистика часто відображає не лише органічну поведінку аудиторії, а й рівень інформаційного тиску навколо теми чи каналу.

Фактично російськомовні хвилі в коментарях у багатьох випадках стають не показником реального мовного середовища, а маркером інформаційної атаки. І це добре помітно саме на суспільно важливих або військових каналах.

Регіони України: як змінюється мовна карта країни

Одним із найпоказовіших блоків дослідження став регіональний аналіз Telegram-каналів. Саме він дозволяє побачити не лише загальну тенденцію, а й те, наскільки по-різному мовні зміни відбуваються в різних частинах країни.

Захід України

У західних областях частина міст продовжує показувати подальше зростання навіть попри вже дуже високі базові показники. Наприклад, Львів виріс із 93% до 94%, а Хмельницький — із 77% до 95%. Найбільш помітна динаміка — у Тернополі, де частка україномовних коментарів зросла з 82% до 98%.

Фактично в західному регіоні українська мова вже не просто переважає — вона є базовою мовою цифрової комунікації.

Центр України

Центральна Україна продовжує стабільно українізуватися, хоча тут мовна картина все ще значно більш неоднорідна, ніж на заході країни.

Щодо динаміки, Вінниця зросла з 88% до 91%, Житомир утримує стабільні 88%, а Біла Церква демонструє невеликий спад із 81% до 78%. Київ також показує зниження — із 86% до 77%.

У межах дослідження ми аналізували не лише великі Telegram-канали, а й локальні відкриті спільноти, зокрема канали житлових комплексів та районні чати. У результаті середній показник україномовних коментарів у столиці становив 77%, хоча залежно від конкретного каналу цифри коливалися від 54% до 91%. Тому зниження показника не варто трактувати виключно як мовний відкат — воно частково пов'язане зі зміною вибірки та включенням більш різноманітних міських спільнот до аналізу.

Схід і Південь України

Ще кілька років тому більшість міст цього регіону мали переважно російськомовне цифрове середовище. Але зараз ситуація поступово змінюється — і в багатьох випадках дуже помітно.

Харків зріс із 53% до 77% україномовних коментарів. Цей показник базується на аналізі кількох локальних Telegram-каналів, де результати коливаються залежно від аудиторії та тематики. Водночас у частині харківських спільнот українська вже фактично стала мовою за замовчуванням. Миколаїв виріс із 65% до 80%, а Дніпро — із 62% до 71%.

Одеса залишається значно складнішою та більш неоднорідною історією. У межах нового дослідження ми аналізували велику кількість локальних Telegram-каналів і середній показник по місту виявився суттєво нижчим — близько 28%.

При цьому різниця між окремими каналами дуже велика: в одних частка україномовних коментарів становить лише 8%, а в інших сягає 61%.

Окремо варто згадати й окуповані території, де частка україномовних коментарів залишається на рівні 1–10%. Ми не будемо детально зупинятися на цих регіонах, адже причини таких показників є очевидними.

Втім, головне в іншому: навіть у регіонах, які історично вважалися найбільш русифікованими, українська мова демонструє зростання. І в багатьох містах ці показники вже у 2–3 рази вищі, ніж на початку повномасштабного вторгнення.

Чи існує “мовний відкат”?

Питання можливого мовного відкату залишається однією з найобговорюваніших тем у контексті українського цифрового простору. Час від часу в соціальних мережах з’являються твердження про зменшення частки української мови, повернення частини користувачів до російськомовного спілкування або згасання тенденцій, які сформувалися після 2022 року.

Результати дослідження свідчать, що ситуація є більш складною та неоднорідною. Дійсно, в окремих сегментах ми спостерігаємо певні зміни: на деяких платформах, у конкретних містах або тематичних спільнотах частка україномовної комунікації стала нижчою порівняно з попередніми періодами.

Якщо порівнювати поточні показники з найвищими значеннями, зафіксованими у 2024 році, середня частка україномовних коментарів скоротилася приблизно з 73% до 70%.

Втім, ці зміни варто розглядати в ширшому контексті. Наявні дані радше свідчать про корекцію після періоду стрімкого зростання, ніж про масштабне повернення до попередньої мовної моделі. Попри окремі коливання, українська мова продовжує домінувати в більшості досліджених цифрових середовищ і суттєво переважає показники, які були характерними для українського інтернету до початку повномасштабної війни.

Результати дослідження свідчать, що мовні зміни в українському інтернеті вже давно вийшли за межі короткострокового тренду. Те, що кілька років тому виглядало як активна фаза трансформації, сьогодні дедалі більше нагадує формування нової сталої норми цифрового спілкування.

Зібрані дані показують, що після стрімкого зростання у 2022–2024 роках українська мова не втратила своїх позицій. Попри окремі коливання між платформами, регіонами чи категоріями контенту, саме вона залишається основною мовою взаємодії для значної частини української онлайн-аудиторії.

Водночас найважливішим висновком є не сам рівень показників, а природа цих змін. Вони відбуваються не внаслідок окремих кампаній чи адміністративних рішень, а формуються через щоденний вибір мільйонів користувачів. Саме ця сукупність індивідуальних рішень поступово змінює мовний ландшафт українського інтернету та закріплює українську як природну мову повсякденної цифрової комунікації.