AI бюджети компаній: токени чи люди — новий вибір бізнесу

6 хвилин читання

Витрати на AI більше не виглядають як експериментальна стаття бюджету. Про це говорять у випуску на YouTube-каналі CNBC: фіндиректори великих компаній дедалі частіше порівнюють витрати на токени з витратами на людей. Річні AI бюджети компаній в окремих випадках вичерпуються за місяці, і бізнес уперше серйозно ставить питання — що масштабувати: команду чи обчислення.

Як AI бюджети стали предметом фінансової тривоги

Ще рік тому слово «токени» майже не звучало за межами інженерних команд. Тепер це конкретний рядок у фінансових планах, який CFO обговорюють із радами директорів та інвесторами.

Коли enterprise AI інтегрується у підтримку клієнтів, розробку, внутрішні сервіси та продажі, використання моделей зростає швидше, ніж очікувалося. Інференс — тобто плата за кожен запит до моделі — перетворюється на відчутний фактор маржі.

Читайте також: Вік, у якому людина вперше вступає в статеві стосунки, може бути пов’язаний зі станом здоров’я та якістю життя у старшому віці. Такого висновку дійшли дослідники з Китаю після аналізу великої генетичної бази даних. Про це пише New York Post із посиланням на результати нового наукового дослідження.

На цьому фоні зникає ще одна ілюзія — що нові покоління моделей автоматично дешевшатимуть. Про це прямо говорить CEO Glean Арвінд Джейн. Glean — це корпоративний AI-асистент, який інтегрується у внутрішні системи великих компаній і допомагає співробітникам працювати з даними, документами та бізнес-процесами за допомогою різних мовних моделей.

За словами Джейна, кожна нова генерація frontier-моделей виявляється майже вдвічі дорожчою за попередню в перерахунку на токен. Це означає, що вартість масштабування AI зростає саме тоді, коли бізнес починає використовувати його по-справжньому.

Тобто витрати на найпотужніші моделі зростають саме тоді, коли бізнес переходить до масштабування.

$300 млн ARR: зростання без ілюзій

Glean, корпоративний AI-асистент для компаній рівня Fortune 500, досяг $300 млн річного повторюваного доходу (ARR) — проти $100 млн лише 15 місяців тому. Більшість цього зростання забезпечили нові клієнти, що свідчить про активну фазу впровадження enterprise AI.

Проте розмова з клієнтами змінилася. Якщо раніше керівників цікавило, чи працює технологія, то тепер їх турбує інше: як контролювати витрати на AI, коли використання стрімко зростає.

За оцінками компанії, близько 95% корпоративного AI-навантаження припадає на закриті frontier-моделі — OpenAI, Anthropic, Gemini. Саме концентрація на найдорожчих рішеннях і пояснює, чому AI бюджети компаній ростуть швидше, ніж очікувалося.

Підписуйтеся на наші соцмережі

Токени чи люди: нова управлінська дилема

Коли фактичні витрати перевищують фінансові плани, менеджмент змушений шукати баланс. У більшості випадків це не означає негайних звільнень. Але запланований headcount сповільнюється або відкладається.

Якщо замість передбачених у бюджеті $1 млн на AI компанія витрачає $5–10 млн уже на початку року, ці кошти потрібно знайти всередині структури витрат. Найпростіше — переглянути плани найму.

Так з’являється нова формула розподілу ресурсу: більше людей чи більше обчислювальної потужності на кожного співробітника. Для багатьох керівників це незвична логіка — історично технології були дешевшими за людську працю. Сьогодні ж AI дедалі частіше коштує співмірно з нею.

ROI: де AI уже працює, а де — поки що ні

Попри фінансову напругу, більшість компаній не відмовляється від інвестицій у AI. Вони визнають, що витрати поки випереджають вимірювану цінність, але вважають відступ ризикованішим, ніж експерименти.

Найбільш відчутний результат спостерігається у підтримці клієнтів: автоматизація звернень безпосередньо впливає на витрати. У розробці ПЗ команди пишуть більше коду і швидше ітеративно працюють, але це ще не завжди конвертується у стабільне зростання доходів.

У продажах видно зростання продуктивності окремих менеджерів — більше результату на одного account executive. Водночас системного приросту виручки на 10% і більше, який можна чітко прив’язати до витрат на AI, більшість компаній поки не фіксує.

Саме цей розрив між зростанням бюджетів і ще не доведеним ефектом змушує керівників уважніше рахувати кожен токен.

Модельна маршрутизація: практична економія

У відповідь на вибух витрат бізнес починає впроваджувати модельну маршрутизацію (model routing). Ідея проста: не кожне завдання потребує найдорожчої моделі.

Glean і Factory AI працюють як мульти-модельні платформи. Glean надає AI-асистента для enterprise-користувачів, а Factory AI розробляє агентів для автоматизації завдань у розробці програмного забезпечення. Обидві компанії автоматично визначають, яку модель доцільно застосувати — з урахуванням вартості, швидкості та якості.

Різниця в ціні між версіями моделей одного постачальника може сягати 10 разів. Якщо правильно розподілити запити, можна знизити витрати на 30% і більше, а в окремих сценаріях — досягти економії до 10x.

Крім того, частина витрат виникає через неефективну роботу з контекстом: моделі витрачають токени на збирання інформації, перш ніж перейти до виконання завдання. Якщо оптимізувати цей етап, кількість токенів можна скоротити майже удвічі.

Open source як вимушена альтернатива

Ще один шлях оптимізації — перехід на open source-моделі. Деякі з них демонструють значно кращий баланс «ціна/якість», а окремі варіанти можуть бути в дев’ять разів дешевшими за топові frontier-моделі.

Водночас enterprise обережно ставляться до цього варіанту, особливо якщо йдеться про китайські розробки. Один із компромісів — використовувати open source-модель, але хостити її на власній або американській інфраструктурі.

Конкуренція серед провайдерів залишається високою: OpenAI та Anthropic нині лідирують, проте Google і xAI активно нарощують можливості. Домінування жодного гравця не виглядає гарантованим у довгостроковій перспективі.

Від ейфорії до дисципліни

Ринок пройшов фазу «AI за будь-яку ціну» і входить у період фінансової дисципліни. Компанії більше не запитують лише «чи працює це?». Вони питають: «скільки це коштує і чи варте воно цих грошей?».

AI залишається стратегічним напрямом, але тепер рішення ухвалюються не лише інженерами, а й фінансистами. Баланс між токенами та людьми стає центральною темою корпоративного планування.

І саме від того, наскільки швидко бізнес навчиться оптимізувати цей баланс, залежатиме наступний етап розвитку економіки штучного інтелекту.