5 ноября 2025

eur = 93.38 0.00 (0.00 %)

btc = 102 616.00$ -1 181.34 (-1.14 %)

eth = 3 340.74$ - 169.89 (-4.84 %)

ton = 1.93$ -0.05 (-2.37 %)

usd = 80.89 -0.09 (-0.11 %)

eur = 93.38 0.00 (0.00 %)

btc = 102 616.00$ -1 181.34 (-1.14 %)

Apple, NVIDIA и другие компании обучали ИИ на роликах с YouTube без разрешения

1 минута на чтение
Apple, NVIDIA и другие компании обучали ИИ на роликах с YouTube без разрешения

Крупные корпорации, включая Apple и NVIDIA, могли использовать ролики с YouTube для обучения своих нейросетей, пишет редакция Proof News в своём расследовании. По данным издания, ролики использовались без разрешения их создателей.

Предполагаемым нарушителем авторских прав оказалась некоммерческая организация EleutherAI, которая, по её собственному утверждению, помогает разработчикам в обучении моделей ИИ. Её целевой аудиторией является не технологические гиганты, а небольшие разработчики и учёные. EleutherAI выпустила массив данных Pile, значительная часть которого доступна и открыта для любого желающего в интернете — потребуются лишь ресурсы для их скачивания, хранения и обработки.

Согласно подсчётам журналистов, в датасете, использованном корпорациями, есть субтитры с 173536 роликам с YouTube, взятым с более чем 48 тысяч каналов. Представители Apple, NVIDIA и некоторых других компаний не ответили на вопросы издания.

Среди каналов, перечисленных Proof News, фигурируют довольно крупные и известные: MKBHD (19 млн подписчиков), MrBeast (289 млн), Jacksepticeye (31 млн), PewDiePie (111 млн), каналы ток-шоу Стивена Колберта, Джона Оливера и Джимми Киммела, а также каналы образовательных учреждений, таких как Массачусетский технологический институт и Гарвардский университет.

Proof News заявляет, что The Pile использовался Apple, Anthropic, Nvidia и Salesforce в исследовательских работах на тему искусственного интеллекта и для обучения ИИ-моделей. Apple использовала The Pile для обучения Apple Intelligence и модели OpenELM, которую представила в апреле этого года.

Если в ходе данного инцидента действительно было допущено нарушение авторского права, то сделала это в первую очередь некоммерческая организация EleutherAI, а технологические гиганты могли оказаться добросовестными пользователями общедоступного набора данных. Данный пример в очередной раз показывает, что сфера обучения ИИ до сих пор недостаточно отлажена с юридической позиции.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
Раскрыт пароль от системы безопасности ЛувраРаскрыт пароль от системы безопасности ЛувраРаскрыт пароль от системы безопасности Лувра

ГигаЧат: коротко о главном

Раскрыт пароль от системы безопасности Лувра

Полная версия 
В России введут детские SIM-карты

ГигаЧат: коротко о главном

В России введут детские SIM-карты

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Цифра в деле
Цифра в деле
Смотреть
Реклама. ПАО Сбербанк. erid: 2Vtzqv3u7MN
Карьера
Блоги 439
билайн
Газпромбанк
OTP Bank
МТС
Т-Банк
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы