Без помилок у словах: як працює новий генератор зображень ChatGPT Images 2.0

3 хвилин читання

OpenAI створила нову модель генерації зображень ChatGPT Images 2.0, яка створює деталізовані фото й навіть не помиляється у словах. Інструмент уже доступний користувачам ChatGPT, пише TechCrunch.

OpenAI випустила генератор зображень ChatGPT Images 2.0: що він вміє. Скриншот із відео OpenAI на YouTube 

Чому ChatGPT Images 2.0 краще працює з текстом на зображеннях

  • Генеративні моделі штучного інтелекту часто «ламають» написи: вигадують слова або спотворюють літери. Причина полягала у так званих дифузійних моделях, які є основою більшості генераторів. 
  • Вони відновлюють зображення з випадкового шуму і приділяють дрібним елементам мінімум уваги. Дрібний текст, іконки, логотипи — усе це губилось у процесі.
  • У Images 2.0 використали нові методи, зокрема так звані авторегресивні моделі. Саме вони допомогли зробити текст читабельним і придатним для реального використання без додаткового редагування.
Читайте також: OpenAI планує суттєво знизити вартість токенів — одиниць, якими вимірюється і тарифікується використання ШІ-моделей. Компанія готується до цього кроку, побоюючись, що Anthropic зробить аналогічний хід першою. Якщо це станеться, ШІ для бізнесу може стати помітно доступнішим, пише Android Authority. 

Підписуйтеся на наші соцмережі

Якість до 2K і «можливості мислення»: що вміє ChatGPT Images 2.0

У OpenAI зазначають, що нова модель має «можливості мислення». Раніше ми писали, як OpenAI додала схожу логіку «перевірки перед дією» у свого агента ChatGPT, Images 2.0 розвиває цей підхід, але у візуальному форматі. Вони дозволяють:

  • перевіряти результат перед фінальним рендером,
  • створювати кілька варіантів одного зображення,
  • адаптувати графіку під різні формати: рекламу, презентації чи багатокадрові комікси.

Цей генератор зображень відтворює дрібний текст, іконки й складні сцени з роздільною здатністю до 2K. Навіть складні ілюстрації генеруються за кілька хвилин.

Images 2.0 краще працює з нелатинськими мовами, зокрема японською, корейською, гінді й бенгальською. Але база знань моделі обмежена груднем 2025 року, тому деякі візуальні деталі можуть бути не зовсім актуальними.

Чи працюватиме ChatGPT Images 2.0 в Україні 

Інструмент уже відкритий для всіх користувачів ChatGPT й Codex, у тому числі й в Україні. Платні підписники отримують доступ до розширених функцій. Нагадаємо, що в лютому 2026-го OpenAI вже переглядала умови для безкоштовних користувачів, а Images 2.0 вписується в ту саму логіку поступового розширення платного доступу.

Також OpenAI запускає API gpt-image-2 з оплатою залежно від якості й роздільної здатності, це вже орієнтація очевидно на бізнес і розробників. Запуск логічно збігається зі стратегічним розворотом компанії на enterprise, про який OpenAI публічно оголосила ще у березні.