OpenAI створила перший власний ШІ-чип: що таке Jalapeño
OpenAI більше не хоче платити Nvidia за кожен запит до ChatGPT. Компанія разом із Broadcom представила Jalapeño — перший власний ШІ-чип, створений спеціально для запуску великих мовних моделей, пише Engadget.
Що відомо про ШІ-чип Jalapeño
- Jalapeño пройшов шлях від початкового проєктування до готового ШІ-чипа за дев'ять місяців. Для галузі, де подібні цикли зазвичай тривають роками, показник нетиповий.
- OpenAI пояснює таку швидкість глибокою програмно-апаратною співпрацею: інженерні команди OpenAI відповідали за архітектуру, Broadcom — за виробничу експертизу, а частини процесу проєктування та оптимізації прискорювали самі моделі OpenAI.
- Простіше кажучи, штучний інтелект допомагав проєктувати свій власний "мозок".
- OpenAI назвала Jalapeño "першим інтелектуальним процесором". Чип побудований навколо конкретного завдання — inference, тобто безпосереднього запуску LLM-моделей, а не їх навчання.
- Кінцеве тестування продуктивності ще триває, детальний технічний звіт обіцяють найближчими місяцями.
Підписуйтеся на наші соцмережі
Що Jalapeño змінить для ChatGPT і тарифів
Зараз OpenAI, як і більшість ШІ-компаній, залежить від GPU Nvidia — найдорожчого та найдефіцитнішого компонента у ланцюжку постачання ШІ.
Ця залежність прямо впливає на операційні витрати і, зрештою, на те, скільки платять користувачі. Логіка, яку описує OpenAI, та сама, що рухає Amazon із Trainium або Google з TPU: контролюй залізо — контролюй витрати і масштаб.
Як ми писали раніше, Amazon розраховує заощадити десятки мільярдів на рік, просто переключившись на власні ШІ-чіпи замість Nvidia.
Для Broadcom партнерство також стратегічне. Компанія вже допомагала Meta будувати кастомні чипи і поступово стає ключовим гравцем ринку ASIC для ШІ — там, де Nvidia пропонує універсальне рішення, Broadcom допомагає великим клієнтам зробити прискорювач під конкретне завдання.
OpenAI також зазначила, що після нових змін у пам'яті ChatGPT система стала значно «жадібнішою» до обчислень, бо фоновий аналіз розмов потребує постійної роботи моделей.
Власний чип з кращою продуктивністю на ват дозволить обслуговувати більше таких запитів без пропорційного зростання витрат.