В Gemini тепер можна завантажувати аудіо та відео для розшифровки

1 хвилин читання

Gemini отримав нове оновлення, яке значно розширює можливості штучного інтелекту. Тепер користувачі можуть завантажувати аудіо- та відеофайли у популярних форматах, таких як MP3, WAV, M4A, FLAC та OPUS, і отримувати з них повну транскрипцію або стислий підсумок, повідомляє Hello Entrepreneurs.

В Gemini тепер можна завантажувати аудіо та відео для розшифровки. Фото: Hello Entrepreneurs

Які основні функції оновлення Gemini:

  • Підсумовування довгих записів: автоматичне створення короткого резюме лекцій, зустрічей та інших аудіозаписів.
  • Повна транскрипція в текст: можливість перетворювати кожне слово у текст із мітками часу, що дозволяє зручно копіювати, шукати та ділитися матеріалом.
  • Виявлення ключових деталей: автоматичне визначення імен, дат, цифр та важливих пунктів дій.
  • Інтерактивні запитання та відповіді: користувачі можуть ставити питання щодо аудіо, а Gemini одразу видає відповіді без необхідності переглядати весь текст.
Читайте також: Прабхакар Рагхаван (Prabhakar Raghavan) — одна з найвпливовіших фігур у сучасній історії Google, хоча його ім’я рідко з’являється у публічному полі. Його професійна еволюція детально зафіксована на Grokipedia — від теоретика алгоритмів до керівника ключових бізнес-напрямів Google та нинішнього головного технолога компанії. Його кар’єра показує, як «друге обличчя» корпорації може визначати стратегічний курс компанії в період технологічних зламів.