Як reCAPTCHA допомогла Google заробити мільярди доларів
Що таке reCAPTCHA, знає кожний, хто намагався підписати онлайн-петицію, зайти на популярний сайт за посиланням з мережі чи проголосувати у рейтингу на Speka чи The Page. Вам пропонують ввести в текстове поле спотворені цифри і літери з зображення – щоб підтвердити, що ви людина. Ці тести називаються CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart – повністю автоматизований публічний тест Тьюринга для розрізнення комп’ютерів і людей) і найчастіше використовуються на веб-сайтах для запобігання атакам ботів, DDOS і спаму, нагадує Boing Boing.
Як з’явилась reCAPTCHA
У 2007 році інженеру-розробнику Луїсу фон Ану спала на думку геніальна ідея: чому б не використати CAPTCHA для того, щоб прискорити процес оцифрування десятків тисяч відсканованих текстів з книг і газет, які комп’ютери того часу ще не навчилися читати. Його винахід отримав назву reCAPTCHA.
Ідея виявилася дійсно геніальною і ефективною. Газета New York Times використала його для оцифрування свого архіву з 13 мільйонів статей за всі роки свого існування, починаючи з першого номера у 1851 року. До того, нагадаємо, дослідникам доводилось приходити в бібліотеки і переглядати чи не кілометри мікрофільмів з газетними архівами.
Луїс фон Ан, до речі, є одним з розробників і власників Duolingo. На своїх ідеях він заробив вже $1,4 млрд.
Як Google оцифрував майже все за допомоги reCAPTCHA
Google придбав reCAPTCHA в 2009 році і використав її для оцифрування сотень тисяч книг для Google Books і покращення сервісу Google Street View шляхом обробки фотографій вуличних знаків і номерів будинків.
Підписуйтеся на наші соцмережі
Якийсь час мозаїки з картинок і набори символів дійсно допомагали відсіяти ботів.
Але, на жаль, у 2025 році боти стали значно розумнішими і легко долають reCAPTCHA. Проте Google продовжує її пропонувати.
Як Google заробляє мільярди на reCAPTCHA
Тепер reCAPTCHA перетворилася на інструмент відстеження, який збирає дані користувачів і приносить Google мільярдні доходи.
В цьому впевнений блогер-розслідувач CHUPPL (@itsCHUPPL в X).
В своїй статті «Ошелешені та збиті з пантелику: широкомасштабне дослідження реальних користувачів reCAPTCHA v2» Сірлз доводить, що широко використовувана система CAPTCHA від Google є перш за все механізмом для відстеження поведінки користувачів і збору даних, а захист від ботів забезпечує фактично невеликий.
Його дослідження показало, що reCAPTCHA ретельно відстежує:
- файли cookie користувачів,
- історію веб-перегляду,
- середовище браузера – включаючи візуалізацію полотна, роздільну здатність екрана, рухи миші та дані агента користувача.
Усе це можна використовувати для реклами та відстеження.
Проаналізувавши понад 3600 користувачів, дослідники виявили, що капча з мозаїками з зображень займає на 557% – тобто в 6,5 разів (!) – більше часу, ніж тести з чекбоксами. Вони дійшли висновку, що reCAPTCHA коштувала суспільству приблизно 819 млн годин людського часу. Це близько $6,1 млрд.
Використання reCAPTCHA принесло Google величезний прибуток завдяки її спроможності відстежувати поведінку користувачів і збирати дані. Тільки відстеження файлів cookie оцінюється в $888 млрд.
Від reCAPTCHA поки не можна відмовитись, вважає видання.
Водночас, ще у вересні минулого року суд в Австрії суд вирішив, що використання reCAPTCHA не є «важливим». Мовляв, файли cookie, які він встановлює, порушують GDPR/EPD, тому reCAPTCHA є незаконною