NVIDIA обвиняют в использовании "пиратских библиотек" для обучения ИИ

485
3
NVIDIA обвиняют в использовании пиратских библиотек для обучения ИИ

Новый виток судебного разбирательства против NVIDIA вывел скандал с обучением искусственного интеллекта на новый уровень. В расширенном коллективном иске утверждается, что руководство компании не просто знало об использовании защищенных авторским правом материалов, но и целенаправленно одобрило использование "теневых библиотек" с пиратским контентом для обучения своих языковых моделей (LLM), таких как NeMo.

Согласно документам, на которые ссылаются в сети, основная претензия связана с набором данных Books3. Это гигантский архив, содержащий около 197 000 книг, который был извлечен из известного пиратского репозитория Bibliotik. Истцы утверждают, что NVIDIA сознательно игнорировала нелегальное происхождение этих данных, стремясь ускорить разработку своих моделей и сэкономить на лицензионных отчислениях.  

Адвокаты авторов заявляют, что у них есть доказательства того, что сотрудники NVIDIA обсуждали сомнительный статус Books3, но все равно решили использовать его, так как он обеспечивал высокое качество "литературного" обучения для ИИ.

Когда набор данных Books3 был удален с платформы Hugging Face из-за претензий правообладателей, NVIDIA якобы продолжила использовать уже загруженные копии для дообучения своих систем.

Некоторые авторы книг и этого набора теперь требуют от NVIDIA компенсации за нарушение авторских прав. NVIDIA, в свою очередь, придерживается стандартной для индустрии позиции: компания утверждает, что использование данных для обучения ИИ подпадает под доктрину "добросовестного использования", так как создается новый, трансформированный продукт.

Другие публикации по теме
Рынок мобильных игр начинает проседать
Рынок мобильных игр начинает проседать
По данным аналитической компании AppMagic, в 2025 году рынок мобильных игр продемонстрировал резкое замедление роста. Если в 2024 году выручка сектора увеличилась на 3 %, то годом позже показатель составил лишь 0,2 %. Схожая картина наблюдается и в динамике загрузок: рост сократился с 6,6 % в 2024 году до 4,6 % в 2025 году.
Вчера в 20:00
296
2
Форум
Китайская CXMT взорвала рынок памяти, выпустив DDR4‑модуль по цене в 3 раза ниже среднерыночной
Китайская CXMT взорвала рынок памяти, выпустив DDR4‑модуль по цене в 3 раза ниже среднерыночной
Китайская компания ChangXin Memory Technologies (CXMT) сделала громкое заявление, представив модуль оперативной памяти DDR4‑3200 с коррекцией ошибок (ECC) объёмом 32 ГБ. Главное достоинство предложения - это цена, всего $140 (около 11 000 рублей).
Вчера в 18:35
907
17
Форум
Sony заработала 2,37 млрд долларов на выпуске игр на сторонних платформах
Sony заработала 2,37 млрд долларов на выпуске игр на сторонних платформах
Издание TweakTown представило результаты анализа финансовых показателей Sony, которые позволили оценить выручку компании от выпуска игр на платформах, не относящихся к PlayStation.
Вчера в 18:10
101
0
Форум