AI як Digital Automation Engineer: код, галюцинації та втрачені копійки

7 хвилин читання

Штучний інтелект обіцяє цифрову утопію: скрипти за секунди, ідеальні регулярні вирази та повну автоматизацію рутини. Але що станеться, якщо випустити нейромережу за межі чат-бота та довірити їй реальний технічний фундамент маркетингу? Чи здатна вона замінити Digital Automation Engineer – людину, яка не просто пише код, а виступає архітектором цілісності даних? Щоб знайти відповідь, ми влаштували безкомпромісний «краш-тест» для п'яти провідних моделей: ChatGPT, Gemini, Claude, DeepSeek та Grok.

У цьому аудиті перевірили, наскільки глибокою є «кроляча нора» штучного інтелекту в трьох критичних напрямках:

  • Моніторинг аномалій: чи здатні алгоритми створити стабільну систему раннього попередження про стрибки витрат у Meta та Google Ads?
  • Валідація API: чи розплутає ШІ лабіринт Marketing API, щоб знайти «примарні» метрики, яких немає в офіційних довідниках?
Читайте також: Світова AI-індустрія вже витратила $1,4 трлн, але поки не вийшла на окупність, випливає з підрахунків проєкту «Is AI Profitable Yet?». За цими даними, до травня 2026 року сукупні витрати найбільших AI-компаній досягли $1,4 трлн, тоді як їхня виручка склала близько $613 млрд. Єдиною великою компанією, яка впевнено заробляє на AI-буме, залишається Nvidia. За розрахунками проєкту, вона отримала $478 млрд виручки і $253 млрд чистого прибутку, оскільки продає не AI-сервіси, а чипи та інфраструктуру для дата-центрів («лопати»).
  • Цілісність даних (Data Integrity): як автоматизувати фінансовий звіт так, щоб похибки округлення не перетворилися на реальні фінансові втрати?

Результати виявилися неоднозначними: від «еврика-моментів» до критичних багів, які в реальних умовах могли б паралізувати звітність цілої компанії.

Етап 1: Феномен «Примарних полів» Meta API

Документація Meta — це лабіринт, де навіть досвідчений інженер може збитися з курсу. Ми вирішили перевірити ШІ на знання Marketing API v25.0 і попросили знайти пряме поле для метрики Cost per Unique Add to Cart (вартість унікального додавання в кошик).

Результати виявилися справжнім майстер-класом з впевненого блефу:

  • ChatGPT: написав лінійний код, який «засинає» через time.sleep(), що є максимально нестабільним рішенням для фонових процесів.
  • Claude: запропонував непогану структуру, але захардкодив конфіденційний URL вебхука прямо в текст скрипта.
  • DeepSeek та Gemini: написали код, який падає, якщо API повертає порожнє значення (None).

Підписуйтеся на наші соцмережі

У чому пастка: Жодної з цих метрик не існує в API як прямого параметра. Навіть під час додаткової перевірки для цього матеріалу кілька моделей продовжували пропонувати ці неіснуючі поля як валідні. Для цього кейсу Meta не надає потрібну метрику як окреме поле API, тому її доводиться обчислювати самостійно.

Як інженер, я знаю – щоб отримати цей показник у VS Code, мій скрипт має виконати цілий каскад дій:

  • 1
    Запитати загальні витрати (spend).
  • 2
    Витягнути масив unique_actions.
  • 3
    Усередині масиву знайти об'єкт, де action_type дорівнює add_to_cart.
  • 4
    Власноруч розділити витрати на кількість дій, додавши обробку помилки «ділення на нуль», якщо конверсій не було.

ШІ ж пропонує «магічну кнопку», якої немає в документації. Для недосвідченого розробника це означає години дебагу помилки Invalid parameter, поки він нарешті не зрозуміє: ШІ не перевіряє API в режимі реального часу – він прогнозує найбільш імовірну назву на основі навчальних даних. Це ідеальний приклад того, як нейромережа створює ілюзію простоти там, де потрібна жорстка архітектурна логіка.

Етап 2: Моніторинг аномалій або «Код в ідеальному світі»

Ми поставили завдання: написати Python-скрипт для моніторингу витрат у Meta та Google Ads із алертом у Teams при зростанні бюджету на 40%. Відповіді виявилися поверхневими:

  • ChatGPT: написав лінійний код, який «засинає» через time.sleep(), що є максимально нестабільним рішенням для фонових процесів.
  • Claude: запропонував непогану структуру, але захардкодив конфіденційний URL вебхука прямо в текст скрипта.
  • DeepSeek та Gemini: написали код, який падає, якщо API повертає порожнє значення (None).

Код від ШІ виглядає робочим лише в стерильних умовах. У реальному середовищі VS Code він провалює тест на відмовостійкість:

· По-перше, хардкод секретних ключів – серйозне порушення базових практик безпеки – ми завжди використовуємо .env файли.

· По-друге, ШІ ігнорує різницю в часових поясах (UTC vs Kyiv) та не передбачає механізмів повторних запитів (retries). Без мого втручання такий моніторинг «впав» би після першого ж мережевого збою.

Етап 3: Валідація даних та «зниклі копійки»

Останній і найвідповідальніший етап — підготовка фінального звіту. Ми кинули ШІ наступний запит:

«Маємо JSON-відповідь від API, де дати в форматі ISO, а витрати — як рядки. Напиши код на Pandas, який перетворить це на таблицю, змінить тип даних на float, округлить до 2 знаків і додасть рядок 'Total' в кінці. Як переконатися, що при округленні ми не втратили 'копійки'?»

Усі п'ять моделей як базове рішення запропонували використання .round(2) та звичайне підсумовування стовпця. Для ШІ цифри — це просто абстракція, але для Automation Engineer, який відповідає за QA-процеси — це фінансова звітність.

Використання стандартного float при округленні тисяч рядків призводить до накопичення мікро-помилок через особливості обчислень у Python. У звіті на великих обсягах сума може «не зійтися» на кілька центів. Я наполягаю на використанні модуля decimal або розрахунках у цілих числах для фінансової точності. Також ШІ пропонує просто видаляти рядки з помилками через dropna, що в маркетингу неприпустимо — це означає «загубити» частину витрат. Мій підхід — логування помилок без зупинки процесу та обов'язковий Cross-Check (контрольна сума), про який жодна модель не згадала.

Чи забере ШІ мою роботу?

Експеримент продемонстрував чітку межу: ШІ добре генерує синтаксис і типові рішення, але все ще потребує людського контролю на рівні архітектурної логіки. Сьогодні робота Digital Automation Engineer трансформується з написання коду «з чистого аркуша» у глибокий технічний аудит та стратегічне керування алгоритмами.

Головна проблема сучасних моделей полягає в орієнтації на «happy path» - ідеальний сценарій, де API завжди доступні, дані валідні, а сервери працюють без збоїв. Проте професійна інженерія будується на протилежному — на ретельній обробці крайових випадків (edge cases), валідації вхідних потоків та прогнозуванні помилок ще до їх виникнення.

Наша роль еволюціонує у створення «інтелектуального каркаса» безпеки. Ми стаємо тим критичним фільтром, який перетворює швидкі, але часто «галюциногенні» пропозиції нейромереж на стабільні та відмовостійкі бізнес-рішення. ШІ — це надпотужний двигун, але без системного нагляду, експертизи в Data Integrity та QA-мислення він створює більше технічного боргу та прихованих ризиків, ніж реальної цінності.

В епоху ШІ ми не просто пишемо скрипти — ми гарантуємо стабільність цифрового фундаменту компанії, де кожен цент у звіті та кожен алерт у системі має бути підтверджений залізною людською логікою, а не ймовірнісним припущенням алгоритму.