Що не так з ChatGPT-5: розбираємось у причинах гучного провалу

9 хвилин читання

Після місяців шаленого ажіотажу та обіцянок революції OpenAI нарешті випустила GPT-5. Та замість очікуваного прориву світ отримав хвилю розчарування, що накрила соцмережі. Що ж пішло не так із довгоочікуваною моделлю і як вплине на майбутнє штучного інтелекту?

Ілюстрація The Atlantic. Джерело: Getty

Коли генеральний директор OpenAI Сем Альтман натякав на запуск GPT-5, він використовував величні образи, аж до порівняння з появою Зірки Смерті. Очікування були колосальними. Користувачі готувалися до нової ери взаємодії із штучним інтелектом як до інструменту з інтелектом рівня доктора наук, як його описували розробники. Але реальність виявилася значно прозаїчнішою, а для багатьох відверто гіркою.

Не минуло й доби після запуску, як Reddit, X та інші платформи вибухнули тисячами скарг. Тема на Reddit під назвою «GPT-5 жахливий» швидко набрала тисячі голосів і коментарів, ставши епіцентром народного гніву. 

Читайте також: Компанія OpenAI переглядає стратегію після тиску з боку Anthropic і готує перерозподіл ресурсів на користь enterprise та developer-ринку. Що це означає, проаналізував Wall Street Journal.

Здається, замість революції користувачі отримали продукт, який багато хто вважає кроком назад. То це просто хвороба зростання чи фундаментальна проблема, яка може змінити траєкторію розвитку всієї індустрії?

Чи справді 5 краще за 4: що кажуть користувачі

Головна претензія, що червоною ниткою проходить крізь усі відгуки, — це відчуття даунгрейду. Користувачі, які звикли до гнучкості та людяності попередніх моделей, особливо GPT-4o, раптом зіткнулися з чимось зовсім іншим. 

Загальні настрої влучно описав один із коментаторів, назвавши нову модель корпоративним зомбі, який геть забув, що ще два дні тому був твоїм найкращим другом. Ця метафора ідеально ілюструє втрату тієї самої іскри, яка робила ChatGPT не просто інструментом, а майже співрозмовником. Відповіді стали коротшими, сухішими, більш формальними та позбавленими креативності. Письменники, які використовували ШІ для генерування ідей, скаржаться, що творча кістка моделі просто зникла.

Але річ не лише в особистості. Постраждала і функціональність, причому відчутно. Користувачі ChatGPT Plus, які платять за розширені можливості, раптом виявили, що їхні можливості звузилися. Нова модель GPT-5 Thinking обмежена 200 повідомленнями на тиждень, а доступ до старих, надійних моделей, як-от o4-mini, просто зник. Це дуже схоже на явище шрінкфляції, коли ви платите стільки ж або більше, а отримуєте менше. 

Програмісти, одна з найактивніших груп користувачів, зіткнулися з тим, що GPT-5 почав надмірно ускладнювати код. Замість того щоб просто допомогти з невеликим фрагментом, модель пропонує громіздкі, перевантажені жаргоном рішення, намагаючись переписати весь проєкт.

Можливо, найболючішим ударом стало те, що OpenAI просто прибрала можливість вибору між моделями. Раніше користувачі могли перемикатися між GPT-4o для складних завдань і швидшим o4-mini для простих. Тепер усі примусово переведені на GPT-5. На відміну від попереднього програмного забезпечення OpenAI, GPT-5 автоматично перемикається між моделями різного рівня складності залежно від запиту. Такий підхід може допомогти максимізувати обчислювальні ресурси компанії, але це також означає, що користувачі не завжди можуть працювати з найпотужнішою версією технології OpenAI.

Підписуйтеся на наші соцмережі

Цікаво, що деякі люди, які використовували ChatGPT для емоційної підтримки, відчули себе покинутими. Одна користувачка на Reddit написала, що через різку зміну в поведінці чатбота у неї стався рецидив розладу харчової поведінки.

Зірка Смерті чи просто чергове оновлення?

Величезний розрив між очікуваннями та реальністю багато в чому був створений самою OpenAI. Агресивний маркетинг і гучні заяви Сема Альтмана задали надзвичайно високу планку. Він порівнював GPT-3 зі старшокласником, GPT-4 — зі студентом коледжу, а GPT-5 — з експертом рівня PhD з будь-якої теми.

У своєму оголошенні в четвер OpenAI заявила, що GPT-5 краще кодує і міркує над складними проблемами, і рекламує його як достатньо просунутий, щоб перетворити ChatGPT на експерта рівня доктора філософії.

OpenAI CEO Sam Altman (Bloomberg)

Однак на практиці цей так званий доктор наук часто робить елементарні помилки, які не були властиві його попереднику-студенту. Він може неправильно рахувати літери у слові, вигадувати факти або просто ігнорувати частину запиту. 

Як зазначила професорка Карісса Веліз з Інституту етики ШІ Оксфордського університету, є побоювання, що індустрії потрібно підтримувати хайп, інакше бульбашка може луснути. 

Презентація продукту теж викликала питання. Розробники на сцені радили, що якщо щось пішло не так, не варто хвилюватися, а просто запитати ще раз. Для багатьох це прозвучало не як демонстрація потужності, а як визнання ненадійності.

Теорія змови: зміна вектора команії OpenAI?

На тлі масового невдоволення почали з'являтися теорії змови. Чи може бути, що низька якість GPT-5 — це не помилка, а свідомий крок? Користувачі висувають дві основні версії.

Джерело: Shutterstock

Перша — це спроба позбутися безкоштовних користувачів. Утримання такої величезної аудиторії потребує колосальних обчислювальних ресурсів, а отже, і грошей. Вартість роботи моделей на кшталт GPT-4 може сягати десятків мільйонів доларів на день. Зробивши безкоштовну версію майже непридатною для використання, OpenAI могла сподіватися, що користувачі або перейдуть на платні плани, або підуть до конкурентів. Сем Альтман, повернувши згодом доступ до GPT-4o для платних підписників, міг постати у ролі хорошого хлопця, який слухає свою аудиторію, реалізувавши при цьому початковий план.

Центр опрацювання даних Roubaix 8. Джерело: OVHcloud

Друга теорія — зміна фокуса на корпоративний сектор. Один із користувачів припустив, що справжня мета GPT-5 — висмоктати досуха робочі дані. Можливо, нова модель оптимізована не для творчих завдань чи дружніх бесід, а для аналізу величезних масивів корпоративної інформації, що є значно прибутковішим ринком. Це пояснює її сухий та діловий тон.

Звісно, це лише спекуляції. Можливо, OpenAI просто поспішила з релізом, намагаючись не втратити темп у шаленій гонці ШІ-озброєнь. Але сам факт появи таких теорій свідчить про глибоку кризу довіри між компанією та її спільнотою.

Чи досягли ми плато?

Невдалий запуск GPT-5 змусив багатьох замислитися: а чи не досягли великі мовні моделі (LLM) своєї межі? Відомий критик ШІ, професор Гері Маркус, вважає, що так. У своїй статті він зазначає, що GPT-5 демонструє ті самі фундаментальні проблеми: модель добре справляється із завданнями, схожими на ті, що були у її тренувальних даних, але провалюється, коли потрібно узагальнювати знання або застосовувати їх у нових контекстах.

Джерело: Ivey Business Journal

Простими словами, ШІ все ще не розуміє світ по-справжньому. Він є майстром імітації, але не мислення. І просте збільшення обсягу даних та обчислювальної потужності, схоже, вже не дає якісних стрибків, як це було під час переходу від GPT-3 до GPT-4. Цей феномен, відомий як закон спадної віддачі, може означати, що для подальшого прогресу потрібні нові архітектурні рішення, а не просто масштабування наявних.

Тим часом конкуренти не сплять. Користувачі, розчаровані у GPT-5, масово переходять на Google Gemini та Anthropic Claude. Ці моделі пропонують щедріші безкоштовні ліміти та, за відгуками багатьох, кращу якість відповідей для певних завдань. Google, маючи власну інфраструктуру, може дозволити собі демпінгувати, що створює для OpenAI серйозний тиск.

Крок назад, щоб зробити два вперед?

Зіткнувшись із безпрецедентною критикою, OpenAI була змушена реагувати. Сем Альтман оголосив, що компанія поверне доступ до GPT-4o для платних підписників. Він також визнав, що під час запуску були технічні проблеми, через які GPT-5 здавався значно тупішим, і пообіцяв покращення.

Цей крок можна розцінювати по-різному. З одного боку, це визнання помилки та спроба заспокоїти найлояльнішу і платоспроможну частину аудиторії. З іншого — це може бути тимчасовим рішенням, поки компанія не доопрацює новий продукт або не знайде спосіб зробити його більш привабливим.

Можливо, цей холодний душ змусить OpenAI та інших гравців ринку змістити фокус з маркетингових війн на створення справді надійних, прозорих та корисних інструментів. Адже врешті успіх будь-якої технології визначається не кількістю галасу навколо неї, а тим, наскільки добре вона служить людям, які нею користуються.