ШІ-агенти, розумні навушники та «заміна кодерів» — головні новини ШІ-індустрії початку березня
Щотижня в індустрії штучного інтелекту відбуваються значні події: вихід нових моделей, оновлення у галузі робототехніки та зміни в екосистемі стартапів. Щоб ви не пропустили важливі новини, SPEKA підготувала дайджест основних подій галузі за випуском відомого ШІ-блогера Мета Вольфа.
Manus AI: автономний агент для автоматизації завдань
Один із найбільш обговорюваних проєктів останніх тижнів — Manus AI, автономний агент, що може виконувати складні завдання без прямого керування людиною.
Демонстраційні приклади його роботи містять:
- Аналіз резюме. Користувач надає zip-архів із резюме, агент самостійно обробляє їх, читає інформацію та надає порівняльну оцінку кандидатів.
- Пошук нерухомості. Агент отримує критерії (наприклад, безпека району, рівень злочинності), здійснює пошук і створює звіт із відповідними варіантами.
- Фінансовий аналіз. Manus AI може шукати та аналізувати фінансову інформацію, зокрема оцінювати акції на біржі.
- Визначення місць для польотів дронів. Агент знаходить оптимальні локації для дронів у центрі Остіну, перевіряє можливість використання дронів у цих місцях і надає список рекомендованих точок.
Manus AI працює у віртуальному браузері, де самостійно відкриває сайти, здійснює пошук, аналізує контент і навіть виконує дії на вебсторінках. Деякі користувачі зазначають, що сам алгоритм не є принципово новим, а лише інтегрує наявні інструменти (Claude, Sonic, відкриті джерела для вебнавігації), однак його ключова перевага полягає в тому, що ці інструменти об’єднані в одну ефективну систему.
Крім Munus AI, на ринку з’являються й інші автономні агенти:
- Convergence AI Deep Work — агент для глибокого аналізу інформації.
- Harvey AI — агент, що аналізує фінансові звіти та пропонує висновки.
- Google Deep Research — альтернатива Perplexity та OpenAI для збирання та структурування інформації.
OpenAI та Microsoft: нові можливості для ШІ-агентів
Підписуйтеся на наші соцмережі
Компанія OpenAI представила API Responses, що дає змогу розробникам створювати автономні агенти. Це API забезпечує доступ до:
- Вебпошуку — дозволяє агентам отримувати та аналізувати інформацію з відкритих джерел.
- Файлового пошуку — агенти можуть шукати інформацію у локальних або хмарних файлах.
- Обчислювальних функцій — можливість проведення розрахунків на базі отриманих даних.
Після анонсу OpenAI Microsoft інтегрувала Responses API в Azure AI Foundry, що дозволяє підприємствам створювати власні AI-агенти та автоматизувати процеси.
Gemma 3 від Google та нові сервіси
Одне з головних оновлень від Google — випуск моделі Gemma 3, яка:
- Конкурує з DeepSeek R1, маючи лише 27 млрд параметрів (проти 671B у DeepSeek).
- Може працювати на споживчих відеокартах.
- Є мультимодальною, тобто здатна обробляти текст, зображення та відео.
- Доступна для безкоштовного використання через Google AI Studio.
Оновлення також торкнулися моделі Gemini 2.0 Flash, яка отримала:
- Можливість генерації зображень без використання окремого інструменту на зразок Imagen.
- Контекстне вікно до 128 тис. токенів, що допомагає обробляти великі текстові документи.
- Покращену швидкість оброблення запитів.
Google також продовжує інтегрувати ШІ у власні сервіси:
- Gmail тепер може автоматично додавати події з електронної пошти до Google Calendar.
- Google Calendar отримає вбудованого ШІ-асистента, який зможе швидко знаходити вільний час або додавати події.
ШІ у програмуванні: автоматизація коду
У галузі розроблення коду популярності набирають Cursor AI та Bolt AI, які полегшують написання програмного коду. За словами Даріо Амоді, CEO Anthropic, протягом 3–6 місяців штучний інтелект зможе писати до 90% коду, а через рік — майже весь код. Щоправда, подібні заяви вже звучали, але наразі не існує рішень, які дозволяють повністю автоматизувати повноцінне розроблення ПЗ.
Генерація відео та зображень
ШІ-технології покращують роботу з медіаконтентом:
- Moon Valley AI представила відеомодель, що навчена лише на ліцензованих матеріалах.
- Captions Mirage створює AI-анімованих персонажів для рекламних відео, хоча синтезовані голоси поки що не повністю відповідають природному звучанню.
- Snapchat AI Lenses додає віртуальні об’єкти у відео.
Інші ШІ-оновлення
- Perplexity випустила Windows-застосунок, що дає змогу швидко отримувати відповіді на запити.
- Штучний інтелект створив наукову статтю, яка пройшла рецензування та була прийнята на ICLR (The International Conference on Learning Representations ).
Розширюється застосування штучного інтелекту в іграх і технологіях. Meta працює над власними AI-чипами, що зменшить залежність компанії від Nvidia. Apple розробляє AI-навушники, які можуть здійснювати переклад мов у реальному часі. Xbox Co-Pilot — новий інструмент, який допомагає гравцям у проходженні ігор, надаючи підказки та рекомендації.