NVIDIA представила Fugatto — експериментальний ШІ для генерації аудіо

2 хвилин читання

NVIDIA презентувала нову генеративну модель штучного інтелекту під назвою Fugatto (Foundational Generative Audio Transformer Opus 1), здатну створювати аудіо на основі текстових підказок, редагувати існуючі музичні та голосові файли, а також генерувати унікальні звукові композиції.

Про це повідомляє Engadget.

Модель Fugatto може допомогти музичним продюсерам створювати прототипи пісень, розробникам відеоігор генерувати звуки, що змінюються відповідно до дій гравців, або створювати унікальні матеріали для вивчення мов.

Підписуйтеся на наші соцмережі

Читайте також: AI-сервіси стають розумнішими щомісяця, а впровадження стрімко зростає. Та за фасадом технологічного прогресу ховається інша історія – про витрати, субсидії та фінансову концентрацію. Про це йшлося на YouTube-каналі Finance Bureau.

Однією з особливостей Fugatto є комбінування інструкцій, на яких модель навчалася окремо. Наприклад, вона може генерувати мову з конкретним акцентом і емоцією або створювати звукові ефекти, як-от спів птахів під час грози. Крім того, Fugatto може генерувати звуки, які змінюються з часом, як стукіт дощу, що пересувається по ландшафту.

Поки що NVIDIA не оголосила, чи стане Fugatto доступною для широкого загалу. Утім, конкурентні рішення вже існують: Meta пропонує набір ШІ з відкритим кодом для генерації звуків, а Google надає доступ до MusicLM через AI Test Kitchen.

NVIDIA позиціонує Fugatto як перспективний інструмент, що відкриває нові горизонти для творчості та інтерактивного звукового дизайну.