Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

Вікіпедія відкриває дані для розробників ШІ: боти більше не загрожуватимуть серверам

Дар'я Щеглакова
Дар'я Щеглакова новинарка Speka
0
2 хвилин читання

Фонд «Вікімедіа» запустив новий структурований набір даних Вікіпедії, щоб допомогти розробникам штучного інтелекту отримувати потрібну інформацію без необхідності масово аналізувати текст зі сторінок. Набір вже доступний на платформі Kaggle, що належить Google, пише The Verge

Вікіпедія відкриває дані для розробників ШІ: боти більше не загрожуватимуть серверам зображення 1 Вікіпедія спрощує ШІ-доступ до даних і зменшує навантаження на сервери. Фото: dev.ua 

Що входить у набір даних для розробників ШІ від Вікіпедії 

Підписуйтеся на наші соцмережі

Бета-версія має англомовні й франкомовні статті й містить:

  • короткі описи.
  • зведення досліджень.
  • дані з інфобоксів.
  • посилання на зображення.
  • структуровані розділи статей.
  • водночас у наборі немає гіперпосилань, аудіофайлів та інших другорядних елементів.

Новий набір даних Вікіпедії сформовано у форматі JSON, що значно спрощує його використання в задачах машинного навчання ШІ: від побудови моделей до тестування і налаштування. Це також дозволяє зменшити навантаження на сервери Вікіпедії, які потерпають від автоматизованого збору даних.

Ми раді стати майданчиком для даних Вікіпедії та підтримати розвиток інструментів для машинного навчання.
Бренда Флінн, керівниця партнерських проєктів Kaggle 
0
Icon 0

Підписуйтеся на наші соцмережі