Google запускає нові генеративні моделі штучного інтелекту Veo та Imagen 3 для бізнесу

2 хвилин читання

Google почав розгортати приватний доступ до своїх нових генеративних моделей штучного інтелекту — Veo та Imagen 3, повідомляє Engadget.

Google запускає нові генеративні моделі штучного інтелекту Veo та Imagen 3 для бізнесу

З 5 грудня клієнти пакету Vertex AI Google Cloud можуть почати використовувати Veo для створення відео на основі текстових підказок та зображень. У наступному тижні компанія також зробить Imagen 3 доступним для тих же користувачів.

Підписуйтеся на наші соцмережі

Veo від Google стає першою гіпермасштабною хмарною моделлю, що дозволяє генерувати відео на основі текстових і візуальних підказок. Модель створює кадри з роздільною здатністю 1080p, здатні тривати більше хвилини. Вона також може брати зображення, створені штучним інтелектом або людьми, як відправну точку для відео. Незважаючи на значні досягнення, Veo все ще стикається з проблемами в причинно-наслідкових зв’язках, наприклад, смажений зефір на відео не змінює свій колір або не обвуглюється, як би це мало бути в реальності.

Читайте також: У світі, де візуальний контент стає дедалі важливішим, інструменти на основі штучного інтелекту для генерації відео швидко еволюціонують. Нещодавно на каналі «ШІманія» було опубліковано відео з детальним оглядом цієї теми. Ми підготували стислий виклад найважливішого, доповнений практичними порадами та глибоким аналізом, щоб допомогти вам зорієнтуватися у цьому динамічному сегменті ринку.
Google запускає нові генеративні моделі штучного інтелекту Veo та Imagen 3 для бізнесу

Imagen 3, в свою чергу, обіцяє створювати більш реалістичні та деталізовані зображення з простих текстових підказок. За словами Google, нова модель перевершує попередні версії за рівнем деталізації, освітлення та мінімізацією артефактів. Проте навіть тут є місце для вдосконалення, адже в одному з прикладів, створених за допомогою Imagen 3, фотографії групи друзів на багажнику автомобіля не відповідають заданій підказці щодо «фотографії зі спалахом».

Google запускає нові генеративні моделі штучного інтелекту Veo та Imagen 3 для бізнесу