Midjourney версії 4.0. Краща якість, нові функції

5 хвилин читання

На початку листопада компанія Midjourney випустила четверту версію однойменної нейромережі для генерації зображень за текстом. SPEKA розповідає, що нового зʼявилося в апдейті та які ще зміни чекають Midjourney. 

Як працює Midjourney

Компанія Midjourney створила програму штучного інтелекту на основі нейромережі. Вона дає змогу створювати зображення та малюнки завдяки текстовому запиту, який називають підказкою. Midjourney відрізняється своєю здатністю відтворювати не лише об'єкти, а певний стиль мистецтва. Нейромережа доступна для тестування у бета-версії безкоштовно та працює через сервіс Discord.

Як працюють нейромережі, які генерують зображення із тексту, ми писали раніше у матеріалі «Text-to-image. Як нейромережі навчилися генерувати зображення завдяки NLP».

Читайте також: Штучний інтелект уже зараз напряму впливає на виручку, швидкість запуску і навантаження на команду інтернет-магазину. Він закриває те, що бізнес роками робив повільно й вручну — роботу з кошиками, картками товарів, підтримкою, аналітикою та персоналізацією. Саме тут формується конкурентна перевага.

Що нового у четвертій версії Midjourney

Четверта версія має абсолютно нову кодову базу та іншу архітектуру ШІ. Це перша модель, натренована на новому кластері Midjourney AI, над яким працювали дев'ять місяців. 

Першу версію оприлюднили у липні 2022 року. Користувачі помічають, що відтоді алгоритм подолав надзвичайний шлях. 

Нам шкода, але цей блок не підтримується в AMP версії, перейдіть за посиланням,щоб побачити повну версію.

Нова модель може створювати набагато більш реалістичні зображення та розуміє логіку поєднання слів-підказок. Також що більш детальним буде запит, то кращий результат видає нейромережа.  

Крім того, серед оновлень розробники називають такі зміни: 

  • 1
    Більше знань (про істот, місця тощо).
  • 2
    Краще виправляє дрібні деталі.
  • 3
    Обробляє складніші підказки (з кількома рівнями деталізації).
  • 4
    Краще відтворює сцени з кількома об'єктами або багатьма персонажами.
  • 5
    Підтримує розширені функції, як-от підказки із зображеннями та багаторазові підказки.

А ще нова версія дозволяє поєднувати зображення. Користувачі із задоволенням змішують зображення з мемів.

Нам шкода, але цей блок не підтримується в AMP версії, перейдіть за посиланням,щоб побачити повну версію.

А ми поєднали зображення путіна та риби-краплі — офіційного талісмана Товариства гидких тварин. 

Але навіть у порівнянні із версією 3.0. новий алгоритм вирізняється чіткішим промальовуванням та увагою до деталей. Нижче ви бачите зображення, згенеровані Midjourney V3 (ліворуч) та Midjourney V4 (праворуч).

Підписуйтеся на наші соцмережі

Які зміни ще очікують Midjourney? 

Творці нейромережі планують збільшити роздільну здатність, якість та керованість апскейлінгу — процесу перетворення зображень із низькою роздільною здатністю у більш якісні. 

А ще хочуть додати спеціальні співвідношення сторін (натепер доступне лише 1:1), збільшувати різкість зображень та зменшити кількість текстових артефактів.  

Також змінюватимуться правила щодо політики створення та тем для контенту. Перше правило сервісу звучить так: «Не будь придурком і не використовуй наші зображення, щоб засмучувати когось чи викликати драму». Тобто, як і більшість подібних алгоритмів, забороняє створювати зображення, які є агресивними, образливими, пов'язані з насильством або вмістом для дорослих. Деякі слова алгоритм блокує автоматично.

Як застосовують Midjourney у медіа

Журнал The Economist використав алгоритм для створення обкладинки випуску у червні 2022 року, а провідна газета Італії Corriere della Sera опублікувала комікс, створений разом з Midjourney та письменником Ванні Сантоні у серпні 2022 року.

Обкладинка журналу The Economist, створена алгоритмом Midjourney

Чи забирає алгоритм роботу у художників та дизайнерів? 

Засновник Midjourney Девід Хольц каже, що бачить художників як клієнтів, а не конкурентів: деякі з них використовують сервіс для швидкого створення прототипів художніх концепцій, які демонструють клієнтам перед тим, як починати роботу.

Щоправда, є і скептики. Дехто вважає, що використання обкладинок, створених штучним інтелектом, у медіа, забирає замовлення у художників. Зокрема скандал виник на конкурсі цифрового мистецтва на ярмарку штату Колорадо у 2022р. Тоді переміг художник із картиною під назвою Théâtre d'Opéra Spatial, яку створив зокрема за допомогою Midjourney. 

Картина Théâtre d'Opéra Spatial

Інші цифрові художники звинуватили його у шахраюванні, але Джейсон Аллен заявив, що не порушував правил конкурсу. 

Деякі судді не знали, що Midjourney – це програма штучного інтелекту, але пізніше сказали, що навіть якби знали, то все одно обрали б цю картину.

Що створюють користувачі у Midjourney

Після релізу нової версії користувачі Twitter почали активно ділитись своїми творіннями під хештегом #midjourneyv4. Вони створюють абстрактні картини. Наприклад, за запитом «4-вимірне уособлення всесвітньої свідомості»

Нам шкода, але цей блок не підтримується в AMP версії, перейдіть за посиланням,щоб побачити повну версію.

Полароїдні знімки з кастингу моделі, якого ніколи не було. 

Нам шкода, але цей блок не підтримується в AMP версії, перейдіть за посиланням,щоб побачити повну версію.

Креслення роботів із Зоряних Воєн 

Нам шкода, але цей блок не підтримується в AMP версії, перейдіть за посиланням,щоб побачити повну версію.

Експериментують із художніми стилями

Нам шкода, але цей блок не підтримується в AMP версії, перейдіть за посиланням,щоб побачити повну версію.

Відтворюють інтер'єри кав'ярень на основі фото 

Нам шкода, але цей блок не підтримується в AMP версії, перейдіть за посиланням,щоб побачити повну версію.

та просто поєднують усе разом. 

Нам шкода, але цей блок не підтримується в AMP версії, перейдіть за посиланням,щоб побачити повну версію.