Розробники Meta створили штучний інтелект, який стискає аудіофайли

2 хвилин читання

Команда Meta досягла успіхів у галузі гіперстиснення аудіо за допомогою штучного інтелекту. Мережа навчилася стискати файли у 10 разів краще, ніж MP3, без втрати якості.

«Уявіть, що ви слухаєте аудіоповідомлення друга у зоні з низьким доступом до Інтернету, і воно не зупиняється та не збивається. Наше дослідження показує, як ми можемо використовувати ШІ, щоб досягти цього», — пишуть дослідники Meta у блозі.

Інженери створили систему з трьох частин і навчили її наскрізно стискати аудіодані до потрібного розміру. Потім ці дані можна декодувати за допомогою нейронної мережі. Таким чином виходить досягти приблизно 10-кратного рівня стиснення порівняно з MP3 зі швидкістю 64 Кбіт/с без втрати якості. Хоча такі методи були досліджені раніше для мовлення, Meta стали першими, хто спромігся працювати зі стереоаудіо з дискретизацією 48 кГц (тобто, якості CD), що є стандартом для розповсюдження музики. Більш детально про це вони розповідають у дослідницькій статті та діляться кодом і зразками.

Нагадаємо, що команда інженерів з машинного навчання з Meta створила алгоритм Make-A-Video, здатний створювати невеликі відеоролики за текстовим описом.

Читайте також: Instagram створив функцію перестановки сітки профілю. Тепер будь-який користувач може вручну змінити порядок публікацій незалежно від того, коли їх зробив, пише Engadget.

Також раніше стало відомо, що Facebook Reality Labs отримав $3,7 млрд збитків у третьому кварталі порівняно з показником у $2,8 млрд у другому кварталі.