Коли з’явиться українська Gemini: Київстар і Мінцифри почали розробку національної LLM

2 хвилин читання

Київстар спільно з Мінцифри розпочали ключовий етап створення національної великої мовної моделі (LLM), адаптованої до української мови та культурного контексту. Про це Київстар розповів у своєму пресрелізі.

Коли з’явиться українська Gemini: Київстар і Мінцифри почали розробку національної LLM. Фото: Deposit Photos

Що відомо про розвиток національної LLM?

Підписуйтеся на наші соцмережі

Проєкт пройшов шлях від концепції до впровадження перших технічних рішень, і зараз команди переходять до етапу масштабної підготовки даних та формування стандартів якості.

Читайте також: Мінцифра продовжує розробляти українську велику мовну модель (LLM) спільно з “Київстар”. І українці можуть в цьому допомогти, повідомляє Міністерство цифрової трансформації. 

Базою для національної моделі обрали сімейство Gemma від Google, яке адаптують до української мови, історичного та культурного контексту. Особлива увага приділяється підготовці та верифікації даних. Для навчання використовуватимуть відкриті джерела, історичні архіви та документи, деперсоналізовані тексти зі співпраці з державними установами, університетами та медіа.

Для контролю якості створено експертний комітет, який оцінюватиме науково-технічні, правові, мовні та культурно-історичні аспекти моделі. Одним із завдань комітету є розробка бенчмарків для об’єктивної оцінки коректності, безпеки та ефективності LLM.

У січні 2026 року команда планує отримати першу верифіковану базу текстів, покращений токенізатор для української мови та власну систему бенчмарків. Паралельно формується юридична рамка для прозорої роботи з даними та дотримання законодавства про інтелектуальну власність.

Запуск першої бета-версії української LLM заплановано на весну 2026 року. Також у Дії в січні стартує публічне голосування за її офіційну назву.