Наука про дані: дорога іграшка для великих компаній чи вимога часу?

10 хвилин читання

Термін Data Science вперше був використаний більш ніж 60 років тому. Але саме сьогодні ця наука змінює звичні підходи до роботи з даними та стає ключовим чинником розвитку бізнесу. Speka розповідає про трансформацію ролі Data Science в індустрії: як наука про дані розширила межі класичної аналітики й стала драйвером бізнес-інсайтів і прогнозів.

Ми також розкажемо про стратегічні завдання й особливості організації команди Data Science, ключові принципи вимірювання ефективності та важливість глибокої експертизи всередині компанії, адже саме це забезпечує створення унікальних конкурентних переваг.

Олексій Ковальчук, Head of Data & AI Favbet Tech. Фото надене партнером

Розібратися в темі нам допоміг Head of Data & AI Favbet Tech Олексій Ковальчук. На його думку, Data Science — це еволюція індустрії, а не просто ребрендинг. Застосування науки залежить від розвитку бізнесу та готовності до інвестицій в аналітику.

Що таке Data Science?

Data Science — це міждисциплінарна сфера, що поєднує статистику, математику, програмування та інформатику для аналізу, оброблення та інтерпретації великих масивів даних. За її допомогою можна робити прогнози та ухвалювати обґрунтовані рішення у бізнесі. Але для спеціалістів, які працюють у цій галузі давно, все трохи цікавіше.

Олексій Ковальчук

Насамперед Data Science — маркетинговий термін. Хоча він з'явився давно, раніше у нього вкладали не те, що вкладають тепер. Можна сказати, що років 5-10 тому всі data-аналітики, а ще раніше BI-девелопери (Business Intelligence, бізнес-аналітика. — Прим. ред.) були певною мірою спеціалістами з Data Science.

Для бізнесу Data Science — це процес, мета якого — отримати цінність з даних. Робиться це не стандартними засобами, як-от звичайний аналіз і створення метрик, а через випробування гіпотез і пошук певних схованих факторів, що впливають на бізнес.

Слово science, тобто «наука», тут використовується тому, що ми не можемо гарантувати успіх на 100%, як у будь-якій науці. Якщо у data-аналітиці можна стверджувати, що звіт показує правду і нічого крім правди, то в Data Science завжди є версії.

Big Data та Data Science: новий підхід чи зміна назви?

На думку Олексія Ковальчука, Big Data — така сама комерційна історія, створена для того, щоб продати новітню екосистему оброблення даних.

Років 5-10 тому всі хотіли Big Data, але ніхто не знав, що це таке. Хтось інтерпретував це як «об'єм даних, який я не можу обробити на своєму комп'ютері». До них було питання: а чому не сервер? Потім казали, що це об'єм даних, який не може обробитися одним сервером… Таким чином, поява та відхід у тінь нових термінів, як-от Big Data, — це еволюційний розвиток індустрії згідно з тенденціями та технологічними факторами у конкретний момент часу.

Чи потрібна Data Science кожному бізнесу?

Професійна аналітика може бути не по кишені чи навіть просто не потрібна бізнесу на деяких етапах, тому це залежить від того, на якій стадії розвитку перебуває бізнес.

Підписуйтеся на наші соцмережі

Зазвичай, коли ви робите свій продукт, то не думаєте про те, щоб зробити якесь класне аналітичне середовище і щось вимірювати. Ви думаєте про свій продукт. Насамперед бізнес повинен заробляти гроші. Рано думати, як ми будемо вимірювати ці гроші, поки їх не маємо. Коли бізнес розвивається і продукт починає заробляти, що ми робимо спершу? Робимо якісь звіти на тих же базах, які працюють на наш продукт, на операційних даних.
Олексій Ковальчук

Коли бізнес розростається, у нього з’являється більше клієнтів, а отже, накопичується більше даних. Паралельно з цим операційні бази даних збільшуються, а потенціал їхнього використання зменшується. Причина у тому, що вони можуть показувати картину станом на поточний момент, не на якомусь відрізку часу чи у порівнянні.

На цьому етапі бізнес починає використовувати аналітичні системи (OLAP), Data Warehouse. З цим завданням справляються BI та data-аналітики, які показують стан натепер і у порівнянні з історією.

Логічний наступний крок — взяти знання з історії та теперішнього часу і змоделювати майбутнє. Саме цим і займається Data Science. Простими словами, бізнес ставить питання «Як воно буде, якщо...», тестуючи різноманітні гіпотези. Така робота набагато дорожча, але й значно цікавіша, бо змоделювати можна що завгодно. При цьому точність прогнозування напряму залежить від якості даних, їхньої кількості та глибини.

Як Favbet Tech запровадила Data Science?

За словами Head of Data & AI, компанія почала займатися Data Science ще до того, як стало мейнстримом. Специфіка роботи бізнесу полягає у необхідності робити прогнози та прораховувати вірогідності.

Олексій Ковальчук

Ми продовжуємо генерувати дані, категоризувати, описувати. Використовуємо новітні підходи в Data Science для того, щоб змоделювати ситуації із серії «а якщо?» Якщо ми проведемо таку рекламну кампанію? А іншу? Чи спрацюють ці бонуси? А інші? А якщо у грі будуть такі формули використовуватися? Як це впливатиме на гру наших клієнтів? Як покращиться їхній досвід, якщо ми змінимо UI (користувацький інтерфейс. — Прим. ред.)? Це все робиться за допомоги Data Science.

Яка модель ефективніша: створювати свій Data-відділ, користуватися аутсорсом чи будувати гібрид?

Очолювати відділ роботи з даними повинна людина, що матиме компетенцію в основному бізнесі. А от Data-інженери, якщо їм правильно ставити завдання і якщо немає складних моментів з обробленням даних, можуть бути в аутсорсі. У них компетенція досить специфічна, але повторювана. Втім, існують певні моменти, на які варто звернути увагу.

Має бути проста робота: пішов в базу даних, взяв таблицю, налаштував довідники й оновлення. Ця компетенція може бути на аутсорсі. Також важливе питання безпеки. Чи можемо ми дозволити доступ цим спеціалістам?
Олексій Ковальчук

Таким чином, у Data Science дуже важлива компетенція саме у власному бізнесі. Цей досвід не може бути делегований в аутсорс, бо він не залучений у бізнес безпосередньо, а відповідальні працівники можуть змінюватися. Знання, які є в аналітика, мають залишатися у компанії.

Як правильно вимірювати ефективність Data Science у компанії?

Це питання водночас і найбільш очевидне для власників бізнесу, і досить складне, щоб на нього дати просту однозначну відповідь. Ефективність роботи відділу Data Science неможливо виміряти грошима. Мірилом ефективності буде те, що бізнес отримує вчасно дані, які йому потрібні, а не чекає роками, поки вони збираються.

Ми можемо використовувати такі коефіцієнти, як time to market (час від появи ідеї продукту до виходу на ринок. — Прим. ред.). Наприклад, з’явилась якась ідея і ми її випробовуємо та створюємо продукт набагато швидше, якщо пройдемо через моделювання. Ми просто дізнаємося, чи має сенс це взагалі робити. Можна зекономити ресурси на розробленні. Ми не витрачатимемо багато грошей на те, щоб запровадити оновлення, яке по факту нікого не зацікавить. Таким чином, бізнес стане швидшим та більш гнучким, ще й зекономить.

Олексій Ковальчук, Head of Data & AI Favbet Tech. Фото надене партнером

Які найбільш показові приклади впливу Data Science у Favbet Tech?

У Favbet Tech є окрема команда з Data Science, а також BI та команда, яка займається Data Engineering. Це розділені команди, хоча вони всі в одному відділі та тісно співпрацюють між собою. Коли надходить завдання від бізнесу, очільники команд декомпозують її на декілька стримів і формулюють завдання, які мають бути виконані у певній послідовності.

Наприклад, прилітає таке завдання: що для нас краще — накинути коефіцієнтів чи підняти бонуси, щоб покращити retention (утримання клієнтів протягом певного проміжку часу. — Прим. ред.)? Аби щось змоделювати, треба отримати дані. Припустімо, що цих даних у нас немає. Тоді завдання декомпозується. Команда Data Science буде робити ML-модель (machine learning, машинне навчання. — Прим. ред.). Data-інженерна команда повинна піти до операційної системи, зібрати дані, знайти історію. Команда BI має роз'яснити, як можуть калькулюватися ті чи інші показники. Також мають бути довідники, які розказують всім однакову формулу, наприклад, як калькулювати churn rate (коефіцієнт відтоку клієнтів. — Прим. ред.). Коли всі дані готові, ML-команда готує декілька гіпотез.

За результатами роботи команда Data Science Favbet Tech складає звіт. Якщо завдання одноразове, це означає, що можна проводити презентацію для топменеджменту. Коли дані потрібно моніторити щодня, то команда складає стандартизований BI-звіт, доступ до якого отримують ті, кому ці дані потрібні.

З чого краще почати?

Відповісти на це можна, лише маючи розуміння, що потрібно бізнесу. Іншими словами, власники повинні потребувати відповіді на питання, на які поточна команда відповісти не може. Бувають випадки, коли збирається гарна технічна команда, але керівництво не розуміє, чому воно має платити шалені гроші за інфраструктуру Data Science.

Якщо ви хочете почати робити Data Science, то треба принаймні мати двох людей. Почати робити Data Science з одного лише data-інженера не вийде, бо він технічна людина. Йому треба сказати, що йому треба робити — уточнити, що ви хочете дізнатися, поставити питання. Тож спочатку варто зібрати питання, на які не може відповісти стандартний BI. І лише коли є чіткі питання, чіткі потреби бізнесу, можна збирати команду Data Science. Без цього ви отримаєте data-аналітиків, які роблять такі ж репорти, як будь-який BI. Там Data Science буде тільки у назві команди.

Таким чином, якщо стандартний data-аналіз вже не спроможний відповісти на питання бізнесу, це перший маркер того, що треба переходити на новітній tech stack — не звичайні BI-інструменти, а, наприклад, моделі ML та AI (штучний інтелект. — Прим. ред.). Коли звичайними підходами вже не можна робити ту роботу, яку треба робити.

Яке майбутнє у Data Science?

Все нове спочатку отримує хайп. Його називають якимись дуже кричущими словами, з'являється ринок. Ідуть по факту випробування на ринку тієї чи іншої технології. Якщо вона має сенс у бізнесі, підтверджується часом, то стає звичною функцією. У майбутньому можемо очікувати на появу AI-інженерів, промпт-інженерів, ще якихось інженерів… IT — це така індустрія, яка сама собі придумує нові тренди, позиції й завдання. Ну і без моди не обходиться. Мода — це наше все.
Олексій Ковальчук

Колаж: SPEKA Фото: depositphotos