Данило Цьвок про безпеку та етичність використання української LLM
Данило Цьвок, Chief AI Officer Міністерства цифрової трансформації України наголошує, що питання безпеки є надпріоритетним.
Данило Цьвок
Безпека є під час розроблення і та використання.
По-перше, ми використовуватимемо сертифіковані інфраструктури, які відповідають сучасним стандартам безпеки і гарантують якісне та безпечне середовище для тренування моделі.
По-друге, ми здійснюємо анонімізацію персональних даних. Персональні дані не будуть потрапляти у тренувальну вибірку для великої мовної моделі.
По-третє, будуть розроблені та працюватимуть ґардрейли (guardrails — запобіжники). Тобто фільтри на вході і на виході, які унеможливлять prompt injection — спроби маніпуляцій, які можуть вплинути на роботу моделі або послабити рівень її безпеки. Також ґардрейли блокуватимуть запити з етично неприйнятним змістом.
Підписуйтеся на наші соцмережі
Щодо етичного тестування — то важливо, щоб запити, які потрапляють у модель, не містили упереджень, тому буде відбуватися так зване bias-тестування, яке буде здійснюватися протягом різних етапів розробки моделі, як на етапах формування датасетів, так і на етапах безпосереднього тестування якості роботи пілотної моделі.
Тестування проводитиметься, як в автоматизованому форматі так і за допомогою оцінки людей (Human Evaluation). Це дозволить виявити потенційні етичні упередження чи ознаки дискримінації.
Щоб врахувати усі ці моменти, ми створимо етичний та технічний борди з профільних спеціалістів — розробників, юристів, представників державних органів тощо. Вони сформуються технічні та етичні вимоги до моделі і контролюватимуть їх дотримання та фінальний результат роботи моделі».
SPEKA поспілкувалась із Данило Цьвоком, щоб дізнатися як розробники планують боротися з галюцинаціями та дезінформацією, чи планується ділитися напрацюванннями за кордон та які можливості для користувачів надасть українська LLM, — читайте у статті.