Наука про дані: дорога іграшка для великих компаній чи вимога часу?
Термін Data Science вперше був використаний більш ніж 60 років тому. Але саме сьогодні ця наука змінює звичні підходи до роботи з даними та стає ключовим чинником розвитку бізнесу. Speka розповідає про трансформацію ролі Data Science в індустрії: як наука про дані розширила межі класичної аналітики й стала драйвером бізнес-інсайтів і прогнозів.
Ми також розкажемо про стратегічні завдання й особливості організації команди Data Science, ключові принципи вимірювання ефективності та важливість глибокої експертизи всередині компанії, адже саме це забезпечує створення унікальних конкурентних переваг.
Розібратися в темі нам допоміг Head of Data & AI Favbet Tech Олексій Ковальчук. На його думку, Data Science — це еволюція індустрії, а не просто ребрендинг. Застосування науки залежить від розвитку бізнесу та готовності до інвестицій в аналітику.
Що таке Data Science?
Data Science — це міждисциплінарна сфера, що поєднує статистику, математику, програмування та інформатику для аналізу, оброблення та інтерпретації великих масивів даних. За її допомогою можна робити прогнози та ухвалювати обґрунтовані рішення у бізнесі. Але для спеціалістів, які працюють у цій галузі давно, все трохи цікавіше.
Олексій Ковальчук
Насамперед Data Science — маркетинговий термін. Хоча він з'явився давно, раніше у нього вкладали не те, що вкладають тепер. Можна сказати, що років 5-10 тому всі data-аналітики, а ще раніше BI-девелопери (Business Intelligence, бізнес-аналітика. — Прим. ред.) були певною мірою спеціалістами з Data Science.
Для бізнесу Data Science — це процес, мета якого — отримати цінність з даних. Робиться це не стандартними засобами, як-от звичайний аналіз і створення метрик, а через випробування гіпотез і пошук певних схованих факторів, що впливають на бізнес.
Big Data та Data Science: новий підхід чи зміна назви?
На думку Олексія Ковальчука, Big Data — така сама комерційна історія, створена для того, щоб продати новітню екосистему оброблення даних.
Років 5-10 тому всі хотіли Big Data, але ніхто не знав, що це таке. Хтось інтерпретував це як «об'єм даних, який я не можу обробити на своєму комп'ютері». До них було питання: а чому не сервер? Потім казали, що це об'єм даних, який не може обробитися одним сервером… Таким чином, поява та відхід у тінь нових термінів, як-от Big Data, — це еволюційний розвиток індустрії згідно з тенденціями та технологічними факторами у конкретний момент часу.
Чи потрібна Data Science кожному бізнесу?
Професійна аналітика може бути не по кишені чи навіть просто не потрібна бізнесу на деяких етапах, тому це залежить від того, на якій стадії розвитку перебуває бізнес.
Підписуйтеся на наші соцмережі
Коли бізнес розростається, у нього з’являється більше клієнтів, а отже, накопичується більше даних. Паралельно з цим операційні бази даних збільшуються, а потенціал їхнього використання зменшується. Причина у тому, що вони можуть показувати картину станом на поточний момент, не на якомусь відрізку часу чи у порівнянні.
На цьому етапі бізнес починає використовувати аналітичні системи (OLAP), Data Warehouse. З цим завданням справляються BI та data-аналітики, які показують стан натепер і у порівнянні з історією.
Логічний наступний крок — взяти знання з історії та теперішнього часу і змоделювати майбутнє. Саме цим і займається Data Science. Простими словами, бізнес ставить питання «Як воно буде, якщо...», тестуючи різноманітні гіпотези. Така робота набагато дорожча, але й значно цікавіша, бо змоделювати можна що завгодно. При цьому точність прогнозування напряму залежить від якості даних, їхньої кількості та глибини.
Як Favbet Tech запровадила Data Science?
За словами Head of Data & AI, компанія почала займатися Data Science ще до того, як стало мейнстримом. Специфіка роботи бізнесу полягає у необхідності робити прогнози та прораховувати вірогідності.
Олексій Ковальчук
Ми продовжуємо генерувати дані, категоризувати, описувати. Використовуємо новітні підходи в Data Science для того, щоб змоделювати ситуації із серії «а якщо?» Якщо ми проведемо таку рекламну кампанію? А іншу? Чи спрацюють ці бонуси? А інші? А якщо у грі будуть такі формули використовуватися? Як це впливатиме на гру наших клієнтів? Як покращиться їхній досвід, якщо ми змінимо UI (користувацький інтерфейс. — Прим. ред.)? Це все робиться за допомоги Data Science.
Яка модель ефективніша: створювати свій Data-відділ, користуватися аутсорсом чи будувати гібрид?
Очолювати відділ роботи з даними повинна людина, що матиме компетенцію в основному бізнесі. А от Data-інженери, якщо їм правильно ставити завдання і якщо немає складних моментів з обробленням даних, можуть бути в аутсорсі. У них компетенція досить специфічна, але повторювана. Втім, існують певні моменти, на які варто звернути увагу.
Таким чином, у Data Science дуже важлива компетенція саме у власному бізнесі. Цей досвід не може бути делегований в аутсорс, бо він не залучений у бізнес безпосередньо, а відповідальні працівники можуть змінюватися. Знання, які є в аналітика, мають залишатися у компанії.
Як правильно вимірювати ефективність Data Science у компанії?
Це питання водночас і найбільш очевидне для власників бізнесу, і досить складне, щоб на нього дати просту однозначну відповідь. Ефективність роботи відділу Data Science неможливо виміряти грошима. Мірилом ефективності буде те, що бізнес отримує вчасно дані, які йому потрібні, а не чекає роками, поки вони збираються.
Ми можемо використовувати такі коефіцієнти, як time to market (час від появи ідеї продукту до виходу на ринок. — Прим. ред.). Наприклад, з’явилась якась ідея і ми її випробовуємо та створюємо продукт набагато швидше, якщо пройдемо через моделювання. Ми просто дізнаємося, чи має сенс це взагалі робити. Можна зекономити ресурси на розробленні. Ми не витрачатимемо багато грошей на те, щоб запровадити оновлення, яке по факту нікого не зацікавить. Таким чином, бізнес стане швидшим та більш гнучким, ще й зекономить.
Які найбільш показові приклади впливу Data Science у Favbet Tech?
У Favbet Tech є окрема команда з Data Science, а також BI та команда, яка займається Data Engineering. Це розділені команди, хоча вони всі в одному відділі та тісно співпрацюють між собою. Коли надходить завдання від бізнесу, очільники команд декомпозують її на декілька стримів і формулюють завдання, які мають бути виконані у певній послідовності.
За результатами роботи команда Data Science Favbet Tech складає звіт. Якщо завдання одноразове, це означає, що можна проводити презентацію для топменеджменту. Коли дані потрібно моніторити щодня, то команда складає стандартизований BI-звіт, доступ до якого отримують ті, кому ці дані потрібні.
З чого краще почати?
Відповісти на це можна, лише маючи розуміння, що потрібно бізнесу. Іншими словами, власники повинні потребувати відповіді на питання, на які поточна команда відповісти не може. Бувають випадки, коли збирається гарна технічна команда, але керівництво не розуміє, чому воно має платити шалені гроші за інфраструктуру Data Science.
Таким чином, якщо стандартний data-аналіз вже не спроможний відповісти на питання бізнесу, це перший маркер того, що треба переходити на новітній tech stack — не звичайні BI-інструменти, а, наприклад, моделі ML та AI (штучний інтелект. — Прим. ред.). Коли звичайними підходами вже не можна робити ту роботу, яку треба робити.
Яке майбутнє у Data Science?
Колаж: SPEKA Фото: depositphotos