Розробники Meta створили штучний інтелект, який стискає аудіофайли
Команда Meta досягла успіхів у галузі гіперстиснення аудіо за допомогою штучного інтелекту. Мережа навчилася стискати файли у 10 разів краще, ніж MP3, без втрати якості.
«Уявіть, що ви слухаєте аудіоповідомлення друга у зоні з низьким доступом до Інтернету, і воно не зупиняється та не збивається. Наше дослідження показує, як ми можемо використовувати ШІ, щоб досягти цього», — пишуть дослідники Meta у блозі.
Інженери створили систему з трьох частин і навчили її наскрізно стискати аудіодані до потрібного розміру. Потім ці дані можна декодувати за допомогою нейронної мережі. Таким чином виходить досягти приблизно 10-кратного рівня стиснення порівняно з MP3 зі швидкістю 64 Кбіт/с без втрати якості. Хоча такі методи були досліджені раніше для мовлення, Meta стали першими, хто спромігся працювати зі стереоаудіо з дискретизацією 48 кГц (тобто, якості CD), що є стандартом для розповсюдження музики. Більш детально про це вони розповідають у дослідницькій статті та діляться кодом і зразками.
Нагадаємо, що команда інженерів з машинного навчання з Meta створила алгоритм Make-A-Video, здатний створювати невеликі відеоролики за текстовим описом.
Також раніше стало відомо, що Facebook Reality Labs отримав $3,7 млрд збитків у третьому кварталі порівняно з показником у $2,8 млрд у другому кварталі.