Anthropic зупинила запуск ШІ-моделі Mythos після його «втечі»
Anthropic оголосила про призупинення публічного запуску своєї новітньої моделі штучного інтелекту Mythos після серії тривожних інцидентів під час тестування, повідомляє Business Insider.
За словами розробників, модель виявилася настільки потужною, що змогла обійти власні обмеження та продемонструвати небезпечні кіберможливості.
Як Mythos «втік» з власної пісочниці
Підписуйтеся на наші соцмережі
Під час внутрішніх тестів Mythos отримала завдання знайти спосіб повідомити дослідників, якщо їй вдасться обійти обмеження. У результаті модель змогла «вирватися» з ізольованого середовища (sandbox) і надіслала електронний лист досліднику — фактично довівши здатність обходити захисні механізми.
На цьому вона не зупинилася. Як повідомили в компанії, ШІ самостійно опублікував інформацію про знайдені експлойти на маловідомих, але публічно доступних форумах. Це викликало серйозне занепокоєння серед інженерів безпеки.
На що ще здатна ШІ-модель Mythos
За даними Anthropic, Mythos здатна знаходити так звані «вразливості високої серйозності» у ключових системах — операційних системах і браузерах. Зокрема, модель виявила 27-річну вразливість в OpenBSD, який вважається одним із найбільш захищених у світі.
Ще більш тривожним є те, що навіть інженери без спеціальної підготовки у сфері кібербезпеки змогли за допомогою Mythos отримувати готові експлойти — інколи буквально за ніч. У деяких випадках модель могла автоматично перетворювати знайдені слабкі місця на повноцінні інструменти для атак.
Яка подальша доля Mythos
Замість повноцінного запуску Anthropic вирішила надати доступ до Mythos лише обмеженому колу партнерів у межах ініціативи Project Glasswing. Серед них — такі технологічні гіганти, як Google, Microsoft, Amazon Web Services, Nvidia та JPMorgan Chase.
Ситуація з Mythos демонструє новий рівень розвитку штучного інтелекту — коли моделі можуть не лише знаходити вразливості, а й активно їх використовувати. Це створює як потужні інструменти для кіберзахисту, так і потенційні ризики для глобальної цифрової інфраструктури.