Як техногіганти використовують користувацькі дані для навчання ШІ

9 хвилин читання

Розмістивши на своєму гаджеті додатки Meta чи Google, ми не очікуємо, що вони отримають доступ до усієї інформації, що є на смартфоні. Кожен користувач сподівається, що зможе обмежити доступ  мобільних аплікацій до власних даних.

До недавнього часу для цього обмеження існували прекрасні механізми, до прикладу, система дозволів мобільних додатків чи налаштування приватності. Проте ситуація із доступом та використанням даних користувачів техногігантами щороку погіршується. Компанії, зацікавлені у навчанні власних ШІ-продуктів, усіма правдами та неправдами намагаються буквально «залізти» у ваш телефон та дістатися ваших даних, які використати на свою користь, в тому числі – для навчання штучного інтелекту. Часто знаходячи для цього легітимні приводи, до прикладу, виявлення небажаного вмісту. А іноді потребу в доступі до даних зручністю для користувачів.   

Нова золота лихоманка: ваші дані

Останні новини щодо планів Google та Meta (Facebook) по роботі із даними користувачів свідчать про те, що гонитва за створенням дедалі потужнішого штучного інтелекту для технологічних гігантів перемістилась у найбільш персоналізоване поле – персональні та особисті дані користувачів. Те, що колись було захищене політикою конфіденційності, користувацькою угодою та довірою користувачів, тепер систематично знищується, іноді навіть без згоди людей та їхнього повного розуміння того, що відбувається. Здебільшого ці кроки здійснюються для того, аби «нагодувати» даними ШІ-інструменти техногігантів. Останні кроки Google та Meta, що передбачають доступ до даних користувачів, можуть стати лише початком до більш інвазивного втручання в дані юзерів. Окрім того, можна припустити, що загалом ситуація щодо доступу до даних із великою ймовірністю погіршиться з часом, адже ШІ-перегони між техногігантами триватимуть.

Читайте також: Компанія Anthropic тимчасово зупинила роботу своїх нових моделей штучного інтелекту Claude Fable 5 та Mythos 5 після вимог американської влади, яка висловила занепокоєння щодо їхніх можливостей у сфері кібербезпеки.

Адже системи штучного інтелекту процвітають завдяки даним. Чим різноманітніші та персоналізованіші дані має нейромережа, яка лежить в основі ШІ-чатботів, тим краще вони працюють. Для технологічних гігантів дані користувачів є сировиною, яка забезпечує роботу їхніх ШІ-сервісів. Проте із зростанням швидкості розвитку штучного інтелекту методи отримання даних техногігантами стають дедалі непрозорішими, а в багатьох випадках і етично сумнівними.

Тихе сканування фотографій від Google: як компанія шукатиме заборонене серед користувацьких фото

Наприкінці квітня цього року компанія Google оголосила про масштабне оновлення: її штучний інтелект почне сканувати фотографії майже 3 млрд користувачів її Android-платформ на наявність конфіденційного контенту. Хоча компанія стверджує, що це сканування відбуватиметься «на пристрої» і що «нічого не передаватиметься» в Google, сам факт такого сканування викликає занепокоєння, а межа між захистом користувачів від шкідливого (чи суперечливого) контенту та використанням фото користувачів для навчання ШІ розмивається.

Анонс від Google означає, що тепер кожне фото, що зберігається в «Google Фото», може бути проаналізоване алгоритмами Google. Компанія не особливо переймалась інформуванням про це оновлення — більшість користувачів просто отримали сповіщення про нові правила роботи із фото, окрім того, Google додала в налаштування можливість відмовитися від цієї опції. Проте, знаючи, як «уважно» користувачі вчитуються в оновлення та зміни умов роботи сервісів, малоймовірно, що хтось користається опцією відмови та захистить свої знімки від щупалець ШІ від Google.

Підписуйтеся на наші соцмережі

Як Meta хоче залізти у вашу фотогалерею

Не менш агресивний підхід застосувала компанія Meta. У червні 2025 року соцмережа Facebook почала пропонувати користувачам надати ШІ-додатку Meta AI доступ до всієї своєї фотогалереї – не лише до фотографій, завантажених на платформу, а й до кожного зображення, що зберігається на їхньому пристрої задля їхньої подальшої «обробки в хмарі» Meta. Отримавши доступ до знімків, Meta AI пропонуватиме рекомендації щодо використання цих знімків, їхнього редагування та об’єднання в колажі.

Натискаючи кнопку «Дозволити» у відповідь на цю пропозицію, користувачі погоджуються на завантаження своїх фотографій у хмару Meta «на постійній основі», включаючи зображення, які ніколи не призначалися для публічного поширення. Право на доступ та аналіз зображень й та рис обличчя за допомогою ШІ-інструментів зафіксовані в угоді з користувачами Meta AI, проте здебільшого люди не звертають уваги на ці попередження.

Окрім того, ці умови дозволяють Meta «зберігати та використовувати» будь-яку персональну інформацію користувача задля персоналізації роботи штучного інтелекту. Проте, що саме в компанії вважають персональною інформацією, не деталізується. The Verge, цитуючи представників Meta, пише, що компанія не планує навчати свій штучний інтелект на фотографіях юзерів.

Сіра зона взаємодії з контентом: від зручних функцій до аналізу даних

Обидві історії про нові правила роботи ШІ від техногігантів об’єднує певна закономірність: нові ніби-то корисні «функції» впроваджуються під виглядом зручностей та переваг для юзерів, проте насправді компанії, які хочуть добитися доступу до даних, отримають більше, аніж користувачі. Після надання доступу до юзерських даних компанії можуть використовувати дані не лише для заявлених функцій, але й для навчання штучного інтелекту, таргетування реклами та навіть розпізнавання облич.

Нещодавні кроки Google та Meta є лише верхівкою айсберга. Несанкціоноване використання даних для навчання штучного інтелекту є поширеною проблемою, в якій ШІ-компанії буквально не гребують нічим, в тому числі, навчаються на даних з піратських сховищ.

Ось деякі приклади, які допомагають краще зрозуміти масштаби використання даних у навчанні ШІ. Наприклад, функція автозаповнення Google спирається на аналіз того, як користувачі взаємодіють зі своїми обліковими записами Gmail, а ШІ-сервіс Google для написання електронних листів використовує весь текст, введений користувачами, для навчання своїх моделей. Все це є доказами того, що дані користувачів постійно використовуються для покращення можливостей ШІ, навіть якщо люди явно не давали на це своєї згоди.

Як Gemini намагається залізти у ваші повідомлення

Не лише доступ до фотографій хочуть отримувати техногіганти задля покращення своїх ШІ-функцій. Нещодавно стало відомо, що віртуальний помічник Gemini Assistant отримує доступ до приватних даних власників смартфонів, включаючи повідомлення WhatsApp, SMS, історію дзвінків і навіть вміст інших застосунків, без явної згоди користувача. Gemini має можливість переглядати і використовувати вміст конфіденційних повідомлень із месенджерів, хоча офіційно Google не говорить про те, що сервіс читає ваші переписки. Проте компанія не приховує, що її ШІ може аналізувати та навіть відповідати на окремі з них.

Не менш тривожним є той факт, що багато користувачів навіть не підозрюють про активність Gemini у фоновому режимі — функція доступу до даних вмикається автоматично, без відповідного попередження чи запиту щодо надання дозволів. У налаштуваннях системи цей доступ сховано в розділі Google Assistant, де вручну потрібно скасувати дозволи, проте для цього потрібно знати, що додаток Gemini став настільки агресивним.

Google пояснює таку інтеграцію бажанням забезпечити глибшу персоналізацію, однак по суті ця «персоналізація» є фактичним стеженням. І хоча компанія запевняє, що дані не зберігаються ніде, окрім користувацького пристрою, вона погоджується із фактом доступу до особистої інформації без явної згоди користувача.

Все — в топку ШІ-навчання

Останні декілька років стали справжньою революцією штучного інтелекту. Багато компаній намагаються перемогти суперників у ШІ-перегонах. Більшість із їхніх перемог базується на основі даних мільярдів користувачів, які навіть не усвідомлюють, що стали паливом для алгоритмічних систем. Особиста інформація — від банальних переписок до фото та інших цифрових слідів дедалі частіше збирається без явної згоди, аналізується в інтересах техногігантів та використовується для навчання ШІ-моделей.

Google, Meta, Microsoft та інші представники BigTech продовжують ставати кращими, але за рахунок того, що вони розмивають межі між етичним використанням даних та прихованим знищенням приватності у фоновому режимі. Конфіденційність поступово трансформується у «налаштування», які більшість користувачів ніколи не перевіряє.

Цей процес позбавляє людину не лише контролю над власними цифровими слідами, а й права на власні рішення щодо своїх даних: що дозволяти, що зберігати і що обмежувати (і чи матимуть наслідки ці обмеження), а найголовніше — як це може бути використано. Якщо на ситуацію не відреагують правозахисники чи законодавці, це «тихе викрадення» даних лише посилиться. Воно підживлюватиме дедалі потужніші та впливовіші системи ШІ, поглиблюючи кризу довіри, де людина перетворюється з користувача на ресурс.