Мінцифри та Київстар обрали базову модель для тренування національної LLM
2 хвилин читання
Міністерство цифрової трансформації України разом із Київстаром визначилися з великою мовною моделлю, на основі якої тренуватимуть національну українську LLM. Базою стане Gemma 3 — відкрита модель Google нового покоління, що вже продемонструвала високу якість роботи з українською мовою, повідомляє пресслужба Мінцифри.
Зазначив Данило Цьвок, Chief AI Officer Мінцифри та CEO WINWIN AI Center of Excellence.
Як адаптуватимуть Gemma для України?
Підписуйтеся на наші соцмережі
Читайте також:
Штучний інтелект в Україні давно вийшов за межі лабораторій і технічних конференцій і стає інструментом стратегічної трансформації держави та економіки. Його інтеграція в державні сервіси, освіту та бізнес уже визначає конкурентоспроможність країни.
У межах проєкту планують:
- Удосконалити український токенайзер, щоб підвищити точність генерації текстів та оптимізувати обчислення;
- Донавчити модель на великому масиві унікальних україномовних текстів, які зараз збирають експерти;
- Розробити локальні бенчмарки для точнішого налаштування та оцінювання моделі.
Сказав Михайло Нестор, директор з розробки диджитал-продуктів Київстар.
Чому саме Gemma?
Серед ключових переваг моделі:
- Висока якість при помірних інфраструктурних вимогах — одна з найкращих open-source LLM у співвідношенні «розмір/якість»;
- Багатомовність і готовність до донавчання українською;
- Мультимодальність, що дозволяє працювати з текстами та зображеннями;
- Розширений токенайзер та довге контекстне вікно (128 тис. токенів);
- Кілька розмірів моделі, що спрощує підбір ресурсоємності під конкретні задачі.
Gemma вже продемонструвала ефективність у створенні українських LLM, зокрема, MamayLM та Lapa LLM. Також її використовують у болгарській сучасній моделі INSAIT BgGPT.