Google урізала Meta доступ до Gemini: ШІ-бум уперся в дефіцит комп’ютерів

6 хвилин читання

Штучний інтелект роками описували як гонку моделей: хто створить розумнішого чатбота, швидший інструмент для коду чи точнішу систему модерації. Але нова межа ШІ-буму виявилася набагато приземленішою — фізичні комп’ютери, дата-центри, чипи та електроенергія.

Навіть Google, один із головних гравців ринку штучного інтелекту, змушена обмежувати доступ Meta до моделей Gemini, розповів YouTube-канал Firstpost із посиланням на Financial Times. Причина не в публічному конфлікті між корпораціями й не в зміні партнерства. Meta хотіла купити більше обчислювальних потужностей, ніж Google могла надати.

Цей випадок показує, що індустрія ШІ входить у нову фазу. Тепер швидкість розвитку визначають не лише алгоритми, а й те, скільки серверів, чипів і енергії компанія реально має для щоденної роботи моделей.

Google Gemini і Meta: чому Big Tech уперся в дефіцит ШІ-потужностей

Читайте також: Через 50 років після заснування компанія Apple опинилася перед найсерйознішим стратегічним викликом у своїй історії. Про це йдеться у відео YouTube-каналу CNBC.

Meta, якій належать Facebook, Instagram і WhatsApp, використовує Google Gemini для внутрішніх бізнес-завдань. Моделі допомагають компанії виявляти шахрайство, видаляти шкідливий контент, підтримувати команди клієнтського сервісу, допомагати у програмуванні та розвивати рекламні інструменти.

Приблизно у березні Google повідомила Meta, що не зможе забезпечити весь обсяг обчислювальних потужностей Gemini, який компанія хотіла придбати. Для Meta це стало не просто технічним лімітом. Частина її ШІ-проєктів, за повідомленнями, була відкладена.

Схожі обмеження відчули й інші клієнти Google, але саме Meta постраждала найбільше, бо є одним із найбільших користувачів Gemini. І саме тут проблема виходить за межі одного контракту: якщо навіть Big Tech не завжди отримує потрібний обсяг ШІ-потужностей, ринок стикається з новим типом дефіциту.

AI inference: як щоденне використання ШІ створює інфраструктурний тиск

Підписуйтеся на наші соцмережі

За кожною відповіддю чатбота, згенерованим фрагментом коду чи створеним текстом стоїть обчислювальна робота. Цей процес називають AI inference — використанням уже навчених моделей для виконання конкретних запитів.

Саме inference став одним із головних вузьких місць ринку штучного інтелекту. Моделі вже створені, попит із боку бізнесу й користувачів стрімко зростає, але кожен запит треба фізично обробити на потужних серверах. Коли мільйони людей щодня працюють із ШІ, навантаження на інфраструктуру зростає швидше, ніж компанії встигають будувати нові дата-центри.

Google фактично визнала цю проблему під час звіту за перший квартал. Гендиректор компанії Сундар Пічаї заявив, що Google Cloud уперше отримав понад $20 млрд виторгу, але бізнес міг би заробити ще більше, якби мав достатньо обчислювальних потужностей. Він описав ситуацію як compute constraint — стан, коли попит перевищує доступну інфраструктуру.

Це змінює саму логіку конкуренції. Раніше головним питанням було, хто має найсильнішу модель. Тепер не менш важливо, хто має достатньо серверів, чипів і електроенергії, щоб ця модель працювала в масштабі.

Meta AI, Llama і Muse Spark: як компанія зменшує залежність від Gemini

Обмеження Google змусили Meta уважніше подивитися на власне використання ШІ. Компанія попросила співробітників працювати з AI-інструментами ефективніше і скорочувати використання AI-токенів — одиниць, якими вимірюють обсяг роботи моделі.

Для звичайного користувача токени можуть здаватися технічною деталлю. Для компанії масштабу Meta це прямі витрати й навантаження на дефіцитну інфраструктуру. Що більше запитів, довших промптів і складніших завдань обробляє модель, то більше потрібно обчислювальних ресурсів.

Водночас Meta активніше покладається на власні ШІ-моделі. Спершу компанія обрала Gemini, бо ці моделі краще за відкриті Llama виконували низку бізнес-завдань. Тепер частину роботи, за повідомленнями, переводять на новішу модель Muse Spark. Усередині компанії вважають, що вона стає достатньо конкурентною, щоб зменшити залежність Meta від зовнішніх постачальників ШІ.

ШІ-інфраструктура Google: чому дефіцит Gemini не зникне швидко

Проблема Meta не означає, що Google не розширює інфраструктуру. Навпаки, компанія намагається нарощувати її якомога швидше. Але такі проєкти не запускаються миттєво: потрібні чипи, сервери, дата-центри, електроживлення, охолодження і складні ланцюги постачання.

За повідомленнями, Google уклала угоду приблизно на $920 млн на місяць, щоб орендувати додаткові обчислювальні потужності у SpaceX Ілона Маска. Масштаб цієї суми показує, наскільки дорогим став наступний етап розвитку штучного інтелекту.

Для Google це водночас сильна і складна позиція. Попит на Gemini та Google Cloud підтверджує, що ринок готовий платити за ШІ-інструменти. Але компанія не може повністю монетизувати цей попит, доки її фізична інфраструктура не наздожене потреби клієнтів.

Дефіцит обчислювальних потужностей змінює правила ринку ШІ

Історія з Meta і Google Gemini показує, що ринок штучного інтелекту більше не можна оцінювати лише за якістю моделей. Наступна перевага буде у тих, хто здатен забезпечити роботу ШІ для мільйонів користувачів одночасно.

Для великих компаній це означає нову дисципліну витрат: ШІ треба не просто впроваджувати, а використовувати раціонально. Для ринку — посилення перегонів за чипи, дата-центри та енергетичні ресурси. Для користувачів — ризик, що навіть найпотужніші технологічні компанії тимчасово дозуватимуть доступ до найкращих моделей.

Поки нові чипи й дата-центри не запрацюють у достатньому масштабі, штучний інтелект залишатиметься не лише програмним, а й інфраструктурним бізнесом. Саме дефіцит обчислювальних потужностей може визначати, які компанії рухатимуться швидше, а які будуть змушені відкладати власні ШІ-плани.