GPT-5: нова ера ШІ чи розігрітий хайп?
Останні місяці у світі штучного інтелекту було лише одне гаряче обговорення — поява GPT-5 від OpenAI. Хайп був колосальним, а очікування сягали небачених висот, адже багато хто сподівався, що нова модель стане тим самим AGI — універсальним штучним інтелектом, який зможе виконати будь-яке когнітивне завдання не гірше за людину. З таким рівнем зачарування рівень розчарування виявився доволі високим, хоча багато користувачів відзначають значні покращення. На YouTube-каналі «ШІманія» вийшов детальний огляд цієї події, а ми підготували для вас короткий виклад найважливішого, щоб допомогти зрозуміти, які реальні переваги надає GPT-5.
Що нового: автоматичний розподіл запитів та "режим міркування"
Компанія OpenAI не лише представила нову модель, а й кардинально змінила підхід до роботи самого ChatGPT. Головним нововведенням стала автоматична маршрутизація запитів. Тепер система самостійно вирішує, куди спрямувати ваше питання: просте — до базової моделі, а складне — до так званої «міркувальної», що не дає миттєвої відповіді, а витрачає час на обдумування. Це нововведення мало б зробити роботу з чат-ботом набагато зручнішою, звільняючи користувача від необхідності обирати модель. Проте, як виявилося, маршрутизація працює не бездоганно. Варто віддати належне OpenAI, які швидко відреагували на критику та повернули підписникам доступ до більшості моделей, які раніше намагалися вивести з обігу.
Тест на реальність: чи поборола GPT-5 галюцинації?
Загалом GPT-5 — розумна модель, але саме через це її помилки в елементарних питаннях викликають ще більше здивування. Наприклад, базова версія не змогла одразу вирішити просте рівняння, помилково вважаючи, що 0.11 більше за 0.9. Лише після команди «подумати краще» чат-бот увімкнув режим міркування, вісім секунд обдумував відповідь і видав вірний результат. Для порівняння, безкоштовна і невибаглива до ресурсів модель Google Gemma-3n легко впоралася з цим завданням. Хоча рівень галюцинацій в GPT-5 знизився, для базової моделі покращення не настільки відчутне, як для «міркувальної» версії.
Модель також продемонструвала проблеми з аналізом візуальних даних. Під час аналізу діаграми від OpenAI, «міркувальний» варіант GPT-5 дав слушні поради щодо покращення, вказавши на некоректне змішування метрик і невдалу палітру. Проте в автоматичному режимі модель виявилася менш критичною. Вона зазначила, що стовпчики не підписані значеннями, хоча насправді це було зроблено. Також GPT-5 видала хибну інформацію під час аналізу офіційної документації, назвавши вигадану цифру про рівень галюцинацій, якої в документі не було.
Підписуйтеся на наші соцмережі
Стиль комунікації також змінився. Чат-бот став менш нав'язливим і намагається уникати зайвого тексту, що робить його відповіді більш лаконічними. Під час тесту з «геніальною» бізнес-ідеєю інвестицій у вигадану криптовалюту «шікоін», жодна з моделей не підтримала ідею, виділивши тривожні сигнали, проте й однозначного «ні» не дала, запропонувавши інвестувати «якийсь відсоток» заощаджень.
GPT-5 у дії: від творчих завдань до фронтенд-розробки
Всупереч усім недолікам, GPT-5 продемонструвала вражаючі результати в деяких сферах. Одним з головних акцентів стала фронтенд-розробка. Модель здатна створювати односторінкові сайти, анімації, ігри та застосунки на основі простих текстових запитів. Вона легко згенерувала гру «Тетріс» з кириличними літерами, застосунок для вивчення мови та навіть програму для створення масок для фото. Крім того, склалося враження, що нова модель краще справляється з виправленням багів.
Проте не всі творчі завдання даються їй однаково легко. Наприклад, українська поезія досі залишається викликом для моделі. Хоча «міркувальна» версія змогла створити вірш з римою, він не може зрівнятися з текстом, написаним GPT-4o. Схожа ситуація і з генеруванням прози: обидві моделі (автоматична та міркувальна) провалили тест на написання тосту, зробивши недоречні припущення. Це підтверджує, що генерація якісного креативного тексту досі залишається складним завданням для ШІ, особливо для мов, відмінних від англійської.
Аналіз документів та код: де модель справді вражає
Якщо відійти від творчості, то у професійних завданнях GPT-5 демонструє справжню силу. Вона добре впоралася з написанням анотації до наукової статті з перекладом, а «міркувальна» версія навіть додала мету, методологію та ключові слова.
Найбільше вражає її здатність виявляти помилки у документах. Під час тесту, коли у текст були навмисно внесені орфографічні та логічні помилки, GPT-5 виявила їх усі. Наприклад, вона помітила, що «один з десяти» був змінений на «десять з одного» і фраза «автоматизує» замінена на «не автоматизує». У «міркувальному» режимі вона навіть знайшла більш тонкі неточності, такі як непослідовність у написанні слова «help desk».
Для розробників, які створюють демоверсії, GPT-5 також є незамінним помічником. Вона згенерувала стартовий пакет скриптів, що складається з десятків файлів та робочої структури папок. Цей код запустився з першого разу, що свідчить про значні покращення в якості генерації коду.
Порівнюємо: GPT-5 проти GPT-4o та інші моделі
Порівнюючи GPT-5 з її попередницею GPT-4o, можна дійти висновку, що відмінності не завжди очевидні. Тест «наосліп» виявив мінімальні розбіжності між їхніми відповідями, але у більшості випадків GPT-5 все ж дає дещо кращий результат.
Підсумовуючи, перехід на єдину модель з автоматичною маршрутизацією насамперед вигідний самій OpenAI, адже це оптимізує їхні ресурси. Для користувача ж часто все ще доводиться вручну перемикатися на «міркувальний» режим, щоб отримати якіснішу відповідь. Безперечно, GPT-5 у цьому режимі є значним кроком вперед, особливо у боротьбі з галюцинаціями, написанні коду та аналізі документів. Проте її конкуренти, такі як Gemini 2.5 Pro та Claude, не втрачають своїх позицій.
Глосарій ключових понять
- AGI (Artificial General Intelligence) — Загальний штучний інтелект. Система, яка здатна виконувати будь-яке інтелектуальне завдання на рівні, не гіршому за людський.
- Галюцинації (Hallucinations) — Термін, що використовується для опису ситуацій, коли генеративний ШІ видає неправдиву, вигадану або безглузду інформацію, подаючи її як факт.
- Міркувальний режим (Thinking Mode) — Спеціальний режим роботи ШІ, що витрачає більше часу та обчислювальних ресурсів на опрацювання складних запитів, що забезпечує значно вищу точність та якість відповіді.
- Фронтенд (Frontend) — Частина вебсайту або застосунку, яку бачить та з якою взаємодіє користувач. Включає дизайн, верстку та клієнтську логіку.
Цей матеріал підготовлений на основі інформації з відкритих джерел. Редакція самостійно відбирає ключові факти, аналізує їх та структурує за допомогою AI-інструментів.