Новини ШІ: прорив Google, OpenAI відкриває AI-агентів для всіх, а Китай обходить заборони

5 хвилин читання

У своєму новому відео на YouTube Delivery Director у SoftServe Ігор Матрофайло розповів про головні події у світі штучного інтелекту за останній тиждень. OpenAI відкрила доступ до своїх інструментів AI-агентів, що дозволяє всім будувати власні інтелектуальні системи. Google зробив прорив у генерації зображень та інтегрував AI у пошуковик. Китай обходить санкції та продовжує розвивати свої AI-рішення. Крім того, Microsoft анонсувала Copilot для ігор, а ChatGPT отримав функцію редагування коду на Mac. Розглянемо детальніше всі ці події.

OpenAI відкриває доступ до AI-агентів

OpenAI представила нові інструменти для створення AI-агентів. Користувачі тепер можуть будувати власні системи завдяки Responses API – інструменту, який поєднує різні можливості AI. Головні функції включають:

  • Веб-пошук у реальному часі (аналогічний тому, що використовується в Deep Research).
  • Доступ до файлової системи – можливість працювати з файлами на локальному комп’ютері.
  • Взаємодія з графічним інтерфейсом, зокрема браузером і застосунками на комп’ютері.
Читайте також: Компанія Anthropic тимчасово зупинила роботу своїх нових моделей штучного інтелекту Claude Fable 5 та Mythos 5 після вимог американської влади, яка висловила занепокоєння щодо їхніх можливостей у сфері кібербезпеки.

Також OpenAI випустила OpenAI SDK на GitHub, що дозволяє розробникам створювати кастомні AI-агенти. Це значно спрощує інтеграцію AI в різні проєкти.

Китай обходить санкції у сфері AI

Попри американську заборону на постачання чіпів NVIDIA до Китаю, деякі компанії все ж знаходять обхідні шляхи. Недавно стало відомо, що контрабанда AI-чіпів через Сингапур дозволяє Китаю отримувати заборонені технології.

Згідно з аналітичними даними, 16% процесорів NVIDIA, які мали бути продані Сингапуру, фактично були перенаправлені до Китаю. Це дозволяє китайським компаніям і далі розробляти потужні AI-моделі, створюючи конкуренцію для американських гігантів.

Google додає AI у пошукову систему

Google представив AI Mode у пошуковій системі. Він працюватиме на основі Gemini 2.0 і дозволить отримувати структуровані відповіді на запити, нагадуючи роботу сервісу Perplexity AI.

Цей режим вже доступний для Advanced-підписників (20 доларів на місяць), і найближчим часом очікується його ширший запуск.

ChatGPT на Mac допомагає програмістам

OpenAI додала функцію редагування коду через ChatGPT для Mac. Тепер користувачі можуть інтегрувати AI у редактори коду (наприклад, VS Code) та отримувати автоматичні підказки щодо оптимізації коду.

Підписуйтеся на наші соцмережі

У відео було показано, як ChatGPT аналізує код, пропонує зміни та автоматично редагує файли у VS Code. Це може значно спростити роботу розробників.

Google запускає Data Science-агента

Google додав Data Science-агента до Google Colab. Тепер користувачі можуть завантажувати великі набори даних та отримувати автоматичний аналіз і візуалізацію. Функції включають:

  • Аналіз CSV-файлів.
  • Генерацію кодових фрагментів для обробки даних.
  • Автоматичне створення графіків.

На відео було показано, як агент аналізує дані Stack Overflow і візуалізує найпопулярніші мови програмування 2024 року.

Gemma 3 – найпотужніша AI-модель для одного GPU

Google представив Gemma 3 – AI-модель, яку можна запускати на одному графічному процесорі. Основні характеристики:

  • 27 мільярдів параметрів.
  • Підтримка 140 мов.
  • Контекстне вікно 128 тис. токенів.

У рейтингу відкритих AI-моделей Gemma 3 посіла дев’яте місце, випередивши деякі комерційні моделі.

Google змінює підхід до генерації зображень

Google інтегрував генерацію зображень у Gemini 2.0 Flash. Основні можливості:

  • Генерація зображень у реальному часі.
  • Інтерактивне редагування, як у Photoshop.
  • Поєднання кількох об’єктів в одне зображення.

На демо було показано, як AI створює нові зображення, редагує фотографії та змінює композицію кадрів.

Китайська модель Wan від Qwen

Компанія Qwen (Alibaba) випустила нову відкриту AI-модель для генерації відео. Основні характеристики:

  • Можливість редагування відео в реальному часі.
  • Підтримка тексту у відео.
  • Конкуренція з комерційними моделями.

Цю модель можна використовувати через API або локально на потужних GPU.

Microsoft Copilot для ігор

Microsoft анонсувала Copilot for Gaming – AI-помічника, який допомагає геймерам. Функції включають:

  • Допомогу у проходженні ігор.
  • Генерацію ігрових стратегій.
  • Підказки для покращення ігрового процесу.

Це може бути особливо корисно для кіберспортсменів та новачків у складних іграх

Програмування з ChatGPT

OpenAI продемонструвала інтеграцію ChatGPT з кодовими редакторами. На демо-відео було показано, як AI допомагає у написанні, тестуванні та редагуванні коду у реальному часі. Головні можливості:

  • Автоматична правка помилок у коді.
  • Написання ігор (наприклад, Flappy Bird) за допомогою AI.
  • Спрощений workflow у середовищі VS Code.

Ця функція є важливим кроком до автоматизації розробки.

Висновок

Світ штучного інтелекту розвивається стрімко. OpenAI відкриває нові можливості для створення AI-агентів, Google продовжує революцію у пошуку та генерації контенту, Китай зміцнює свої позиції, а Microsoft розширює можливості AI в іграх. Усе це наближає нас до майбутнього, де AI стане частиною повсякденного життя.

Цей матеріал підготовлений на основі інформації з відкритих джерел. Редакція самостійно відбирає ключові факти, аналізує їх та структурує за допомогою AI-інструментів.