Sora 2, Claude 4.5, Granite: що змінюють нові ШІ-моделі
Світ штучного інтелекту продовжує вражати стрімкістю змін, які мають безпосередній вплив як на цифрову економіку, так і на наше повсякденне життя. Цього разу на YouTube-каналі ШІманія йшлося про справді епохальні події: від новітніх розробок у сфері генерації відео та зображень до критично важливих питань безпеки та корпоративного використання відкритих моделей. Ми підготували короткий виклад найважливішого.
Sora 2 та «Ефект Камео»: передача біометричних даних у соціальні мережі
Презентація нової моделі генерації відео Sora 2 від OpenAI спровокувала активні дискусії не лише про якість відео, а й про майбутнє цифрового простору. Її можливості мимоволі актуалізують теорію «мертвого інтернету», яка припускає, що глобальна мережа неминуче перенасичується ботами та згенерованими ШІ-блогерами. Згідно з цією ідеєю, у не дуже далекому майбутньому знайти іншого homo sapiens з власним поглядом, різними настроями та непередбачуваними реакціями стане великою рідкістю, тоді як ідеального ШІ-партнера знайти буде просто.
OpenAI пішла далі, створивши під Sora 2 окремий застосунок, який прагне перетворитися на своєрідну соціальну мережу (наразі він доступний у США та Канаді). Ключова особливість функціоналу — «cameo» (камео), що дозволяє створювати відео на основі референтних відео реальних людей, а не лише статичних зображень. Ця функція передбачає, що користувач може добровільно дозволити іншим юзерам використовувати свою зовнішність, що фактично є передачею біометричних даних до соціальної мережі. Хоча OpenAI обіцяє повний контроль власників над своїми віртуальними клонами, включаючи можливість відкликати права на використання обличчя та голосу, і всі згенеровані відео позначаються водяним знаком, цей прецедент є новим етичним викликом щодо права на цифрову ідентичність.
Підписуйтеся на наші соцмережі
Claude 4.5 Sonnet: як новий захист агентів впливає на корпоративну безпеку
У сфері безпеки та розробки програмного коду компанія Anthropic представила модель Claude 4.5 Sonnet, яка позиціонується як найкраща модель для програмування. Її високі показники на бенчмарках та значні агентські здібності викликали захват у веб-кодерів. Проте, найбільш вагомий прорив стосується захисту.
Модель має посилений захист від «джейлбрейкінгу» (jailbreaking) — технік написання промтів, які маніпулюють мовними моделями, змушуючи їх порушувати правила. Ця проблема набуває критичного значення з поширенням ШІ-агентів, які мають доступ до конфіденційних внутрішніх баз даних компаній або можуть ініціювати фінансові транзакції. Уявіть сценарій, коли зловмисники приховано вбудовують шкідливі команди у звичайний електронний лист. Жертва просить свого агента зробити резюме непрочитаних листів, і агент ненароком активує ці команди, що може призвести до перерахування коштів компанії або надсилання конфіденційної інформації. За результатами тестування, Claude 4.5 Sonnet суттєво знизила успішність таких атак: лише 40% тестових атак досягали своєї цілі з десяти спроб, що демонструє якісний стрибок у захисті ШІ-агентів від небажаної співпраці.
IBM Granite 4.0: стандартизація ISO та криптографічний підпис для бізнесу
Оновлена лінійка відкритих моделей IBM Granite 4.0 пропонує чіткий вектор для бізнес-сегменту: конфіденційність і комплаєнс. Ці компактні моделі ідеально підходять для роботи з корпоративними даними, оскільки можуть функціонувати локально, не передаючи дані зовнішнім сервісам. Навіть найменша варіація micro споживає лише близько 10 Гб пам'яті, що робить їх доступними для широкого кола компаній. Хоча вони не є найпотужнішими, Granite 4.0 чудово справляється з простими бізнес-задачами, такими як узагальнення інформації, класифікація текстової інформації та генерація відповідей для чат-ботів підтримки клієнтів.
Ключова перевага для великого бізнесу — відповідність моделі сертифікації ISO 42001. IBM заявляє, що це перша відкрита модель, яка досягла цього рівня. Цей міжнародний стандарт підтверджує, що процеси розробки відповідають усім вимогам щодо політики даних, оцінювання ризиків та безпеки, значно спрощуючи комплаєнс при впровадженні. Додатковий рівень надійності забезпечується криптографічним підписом чекпоінтів (кожен реліз підписаний). Це дозволяє кінцевому користувачеві перевірити походження та цілісність файлів моделі перед розгортанням, унеможливлюючи її підміну. Єдиним технічним недоліком є обмежена підтримка мов, що вимагає додаткового доопрацювання для української мови.
Hunyuan Image 3.0: перемога Open-Source та феномен ШІ-акторки Тіллі Норвуд
У креативній галузі відбулися також два важливих зрушення. Китайська компанія Tencent представила Hunyuan Image 3.0, яка, за версією LM Arena, очолила турнірну таблицю, ставши найкращим генератором зображень на основі текстових команд. Це унікальний випадок, оскільки Hunyuan 3.0 — open-source модель (хоча і з нестандартною ліцензією). Вона побудована на авторегресивному фреймворку (подібно до GPT), що дозволяє їй якісно розуміти контекст та генерувати зображення зі змістовного тексту. Це найбільша відкрита модель, побудована як поєднання 64 експертів (MoE-like структура) із загальною кількістю 80 млрд параметрів, з яких одночасно активується близько 13 млрд.
Її переваги: модель краще інтерпретує наміри користувача навіть з лаконічних промтів. Наприклад, у тесті з підрахунком фруктів вона, хоча і не зобразила точну кількість, проте розклала їх послідовно, краще розуміючи ідею. Зображення людей від Hunyuan виглядають більш реалістично, схоже на кадри з фільмів, тоді як у конкурентів (як-от Nano Banana) все ще «відчувається подих ШІ». Недоліком є високі системні вимоги та проблеми з генерацією кирилиці.
У цей же час на кінофестивалі у Цюріху була презентована перша ШІ-акторка Тіллі Норвуд. Її поява викликала хвилю стурбованості та обурення серед акторів-людей, які бачать у ній безпосереднього конкурента. Цей факт створює парадокс: якщо згенерований ШІ-контент є «бездушним та пластмасовим», як стверджують скептики, то і хвилюватися не варто. Проте реакція акторської гільдії чітко свідчить про те, що віртуальні конкуренти вже сприймаються цілком серйозно.
Висновок: нова парадігма взаємодії – людина офлайн, агент онлайн
Стрімкий розвиток штучного інтелекту продовжує ставити перед людством нові виклики, які стосуються як етики (Sora 2 та біометричні дані), так і безпеки (захист агентів Claude 4.5). Проте він також пропонує потужні інструменти для підвищення надійності та ефективності бізнесу (IBM Granite 4.0). Незважаючи на загрозу «мертвого інтернету» та засилля ШІ-контенту, важливо зберігати віру, що місце для людяності у світі завжди буде. Можливо, ми прямуємо до нової, більш збалансованої парадигми: люди більше спілкуються та працюють офлайн, тоді як ШІ-агенти мандрують глобальною мережею, виконуючи рутинні завдання та обробляючи величезні масиви інформації. Таким чином, технологія може стати мостом, що поверне нас до більш осмисленого та соціально орієнтованого життя.
Цей матеріал підготовлений на основі інформації з відкритих джерел. Редакція самостійно відбирає ключові факти, аналізує їх та структурує за допомогою AI-інструментів.