NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

4873
9
NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Расследование Proof News и Wired показало, что богатейшие компании в мире в лице Apple, NVIDIA и многих других использовали 173 000 видео с YouTube для тренировки своих искусственных интеллектов. При этом информация о таком использовании видео компаниями вроде NVIDIA, Apple и Salesforce является официальной.

NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Пак использованных видео называется The Pile, имеет размер в 800 Гб и содержит в себе подготовленные для обучения ИИ данные, которые собраны за счет YouTube-видео компанией EleutherAI для, как заявляется, "рядовых кодеров". Вместе с этим стало известно и об использовании тренировочных данных YouTube Subtitles, которые содержат 173 536 текстовых транскрипций для различных видео. При этом в данном наборе есть более 12 000 давно удаленных с YouTube файлов.

Среди попавших в тренировочные данные видео значится 1862 видео Crash Course, 146 видео Philosophy Tube, 2 видео MrBeast, 337 видео Pewdiepie, 7 видео Marques Brownlee и 90 видео Linus Tech Tips. Некоторые авторы уже успели негативно высказаться о произошедшем. С помощью инструмента по ссылке можно проверить попало ли какое-либо видео в тренировочные данные.

При этом, как заявляется, оба этих пака тренировочных данных нарушают правила пользования YouTube. Кто именно во всем виноват? Никто не признается, и все показывают пальцами друг на друга. Apple и NVIDIA не виноваты потому, что данные собирали не они, а сами сборщики данных на претензии отвечать отказываются.

Другие публикации по теме
Asmongold стал лидером мультистриминга
Asmongold стал лидером мультистриминга
Стример Asmongold, известный на Twitch и Kick, стал лидером мирового рейтинга стримеров по часам просмотра во II квартале 2025 года, обойдя IShowSpeed, Kai Cenat и Hasan.
Сегодня в 11:52
1428
3
Форум
 Twitch, Pinterest и TikTok получили штрафы на 7 миллионов рублей от российского суда
Twitch, Pinterest и TikTok получили штрафы на 7 миллионов рублей от российского суда
Судебное решение подчёркивает важность соблюдения российских норм в области регулирования контента, усиливая контроль над деятельностью зарубежных платформ.
Вчера в 13:11
1922
5
Форум
Депутаты запретили компаниям проводить "теневые автоплатежи" за онлайн-подписки
Депутаты запретили компаниям проводить "теневые автоплатежи" за онлайн-подписки
Правительство одобрило поправки в закон «О защите прав потребителей», которые запретят онлайн-сервисам списывать деньги с карт, удаленных из личного кабинета, и упростят отказ от подписок.
8 июля в 13:41
4958
8
Форум