Новий Claude Fable 5 перевершив конкурентів і отримав спеціальні обмеження безпеки

4 хвилин читання

Компанія Anthropic оголосила про запуск Claude Fable 5 — нової флагманської моделі штучного інтелекту, яку називає найпотужнішою та найрозумнішою у своїй історії, йдеться на їхньому сайті. 

Разом із нею компанія представила Claude Mythos 5 — спеціальну версію моделі для обмеженого кола фахівців із кібербезпеки та наукових досліджень.

Що вміє Claude Fable 5

За словами розробників, Claude Fable 5 демонструє рекордні результати у:

Читайте також: Компанія Anthropic тимчасово зупинила роботу своїх нових моделей штучного інтелекту Claude Fable 5 та Mythos 5 після вимог американської влади, яка висловила занепокоєння щодо їхніх можливостей у сфері кібербезпеки.
  • програмуванні;
  • аналізі великих масивів даних;
  • роботі з документами;
  • наукових дослідженнях;
  • обробці зображень;
  • складних логічних завданнях.

У Anthropic стверджують, що модель перевершує попередні покоління Claude практично в усіх ключових тестах.

Місяці роботи за кілька днів

Під час тестування компанія Stripe повідомила, що Fable 5 виконала масштабну модернізацію програмного коду, яка зазвичай вимагала б роботи цілої команди інженерів протягом двох місяців.

Новій моделі знадобився лише один день.

Також Claude Fable 5 показала високі результати у фінансовому аналізі, роботі з таблицями та складних бізнес-завданнях.

Anthropic впровадила безпрецедентні обмеження для розробників ШІ

Разом із запуском Claude Fable 5 компанія Anthropic представила нові механізми захисту, які вже викликали жваві дискусії в AI-спільноті.

Підписуйтеся на наші соцмережі

Перший рівень захисту досить прозорий. Якщо система вважає запит потенційно чутливим — наприклад, пов'язаним із кібербезпекою, біологією, хімією або спробами відтворення можливостей моделі, — відповідь автоматично генерує менш потужна модель Claude Opus 4.8. Користувач при цьому отримує відповідне повідомлення.

Набагато більше обговорень викликала друга система захисту. Anthropic заявляє, що якщо алгоритми виявлять спроби використовувати Claude Fable 5 для розробки або вдосконалення передових великих мовних моделей (LLM), до таких запитів можуть непомітно застосовуватися спеціальні механізми обмеження.

Серед них:

  • автоматична модифікація промптів;
  • додавання спеціальних векторних корекцій до внутрішніх представлень моделі;
  • застосування технологій, схожих на PEFT або LoRA, які впливають на поведінку нейромережі без повного перенавчання.

Anthropic не розкриває деталі роботи цих механізмів, однак підтверджує, що користувачі не отримуватимуть повідомлення про їх активацію.

За оцінками компанії, подібні обмеження зачіпатимуть приблизно 0,03% усіх запитів.

Значний прогрес у роботі із зображеннями

Anthropic називає Fable 5 найкращою своєю моделлю для візуальних завдань.

ШІ здатний:

  • аналізувати наукові графіки;
  • витягувати дані зі складних схем;
  • відновлювати програмний код за скриншотами;
  • працювати з інтерфейсами програм лише на основі зображень.

Нові можливості для науки

Окрему увагу компанія приділяє можливостям Mythos 5 у біології та медицині.

За даними Anthropic, модель вже допомагає:

  • створювати нові гіпотези у молекулярній біології;
  • пришвидшувати розробку ліків;
  • аналізувати геномні дані;
  • працювати з проєктуванням білків.

У компанії заявляють, що в окремих завданнях Mythos 5 демонструє результати на рівні або навіть вище досвідчених науковців.

Чому модель отримала обмеження

Anthropic визнає, що такі потужні системи можуть використовуватися не лише для корисних цілей.

Зокрема, компанія побоюється застосування моделі для:

  • кібератак;
  • пошуку вразливостей;
  • небезпечних біологічних досліджень;
  • створення конкурентних моделей ШІ шляхом копіювання можливостей Claude.

Саме тому частина запитів автоматично перенаправляється на менш потужну модель Claude Opus 4.8.

За оцінками компанії, такі обмеження спрацьовують менш ніж у 5% сесій.

Що таке Claude Mythos 5

Claude Mythos 5 використовує ту саму базову модель, що й Fable 5, але з ослабленими обмеженнями безпеки для окремих категорій користувачів.

Наразі доступ до неї мають лише партнери програми Project Glasswing та окремі організації, які займаються кібербезпекою.

У майбутньому Anthropic планує розширити доступ через спеціальну програму довіреного використання.