NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

4868
9
NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Расследование Proof News и Wired показало, что богатейшие компании в мире в лице Apple, NVIDIA и многих других использовали 173 000 видео с YouTube для тренировки своих искусственных интеллектов. При этом информация о таком использовании видео компаниями вроде NVIDIA, Apple и Salesforce является официальной.

NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Пак использованных видео называется The Pile, имеет размер в 800 Гб и содержит в себе подготовленные для обучения ИИ данные, которые собраны за счет YouTube-видео компанией EleutherAI для, как заявляется, "рядовых кодеров". Вместе с этим стало известно и об использовании тренировочных данных YouTube Subtitles, которые содержат 173 536 текстовых транскрипций для различных видео. При этом в данном наборе есть более 12 000 давно удаленных с YouTube файлов.

Среди попавших в тренировочные данные видео значится 1862 видео Crash Course, 146 видео Philosophy Tube, 2 видео MrBeast, 337 видео Pewdiepie, 7 видео Marques Brownlee и 90 видео Linus Tech Tips. Некоторые авторы уже успели негативно высказаться о произошедшем. С помощью инструмента по ссылке можно проверить попало ли какое-либо видео в тренировочные данные.

При этом, как заявляется, оба этих пака тренировочных данных нарушают правила пользования YouTube. Кто именно во всем виноват? Никто не признается, и все показывают пальцами друг на друга. Apple и NVIDIA не виноваты потому, что данные собирали не они, а сами сборщики данных на претензии отвечать отказываются.

Другие публикации по теме
YouTube меняет интерфейс своего плеера — теперь "громкость" придется настраивать руками
YouTube меняет интерфейс своего плеера — теперь "громкость" придется настраивать руками
YouTube впервые за десять лет обновил дизайн веб-плеер. Новый интерфейс постепенно появляется у пользователей по всему миру, но, как обычно для Google, развертывание идет волнами, так что в ближайшее время конкретно у вас может ничего и не меняться.
25 апреля в 10:00
7782
7
Форум
База от создателя легендарного аниме Ghost in the Shell: woke-чума убивает восхищение
База от создателя легендарного аниме Ghost in the Shell: woke-чума убивает восхищение
Автор культового аниме «Призрак в доспехах» (Ghost in the Shell) Мамору Ошии порвал в лоскуты современную западную повестку в видеоиграх, выдав базу.
24 апреля в 11:38
4042
3
Форум
Google признана виновной в монополизации цифровой рекламы в США
Google признана виновной в монополизации цифровой рекламы в США
Федеральный суд США признал Google виновной в нарушении антимонопольных законов в сфере технологий онлайн-рекламы. Компания более десяти лет поддерживала доминирование на рынках рекламных платформ и бирж, ограничивая конкуренцию.
18 апреля в 14:20
7804
11
Форум