15 сентября 2025

eur = 97.45 -1.88 (-1.89 %)

btc = 114 670.00$ - 967.42 (-0.84 %)

eth = 4 512.34$ - 122.82 (-2.65 %)

ton = 3.14$ -0.03 (-0.89 %)

usd = 83.07 -1.31 (-1.55 %)

eur = 97.45 -1.88 (-1.89 %)

btc = 114 670.00$ - 967.42 (-0.84 %)

Apple, NVIDIA и другие компании обучали ИИ на роликах с YouTube без разрешения

1 минута на чтение
Apple, NVIDIA и другие компании обучали ИИ на роликах с YouTube без разрешения

Крупные корпорации, включая Apple и NVIDIA, могли использовать ролики с YouTube для обучения своих нейросетей, пишет редакция Proof News в своём расследовании. По данным издания, ролики использовались без разрешения их создателей.

Предполагаемым нарушителем авторских прав оказалась некоммерческая организация EleutherAI, которая, по её собственному утверждению, помогает разработчикам в обучении моделей ИИ. Её целевой аудиторией является не технологические гиганты, а небольшие разработчики и учёные. EleutherAI выпустила массив данных Pile, значительная часть которого доступна и открыта для любого желающего в интернете — потребуются лишь ресурсы для их скачивания, хранения и обработки.

Согласно подсчётам журналистов, в датасете, использованном корпорациями, есть субтитры с 173536 роликам с YouTube, взятым с более чем 48 тысяч каналов. Представители Apple, NVIDIA и некоторых других компаний не ответили на вопросы издания.

Среди каналов, перечисленных Proof News, фигурируют довольно крупные и известные: MKBHD (19 млн подписчиков), MrBeast (289 млн), Jacksepticeye (31 млн), PewDiePie (111 млн), каналы ток-шоу Стивена Колберта, Джона Оливера и Джимми Киммела, а также каналы образовательных учреждений, таких как Массачусетский технологический институт и Гарвардский университет.

Proof News заявляет, что The Pile использовался Apple, Anthropic, Nvidia и Salesforce в исследовательских работах на тему искусственного интеллекта и для обучения ИИ-моделей. Apple использовала The Pile для обучения Apple Intelligence и модели OpenELM, которую представила в апреле этого года.

Если в ходе данного инцидента действительно было допущено нарушение авторского права, то сделала это в первую очередь некоммерческая организация EleutherAI, а технологические гиганты могли оказаться добросовестными пользователями общедоступного набора данных. Данный пример в очередной раз показывает, что сфера обучения ИИ до сих пор недостаточно отлажена с юридической позиции.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
Spotify расширила возможности бесплатных пользователей

ГигаЧат: коротко о главном

Spotify расширила возможности бесплатных пользователей

Полная версия 
«Магнит» запустил тестирование цифрового подтверждения возраста через мессенджер MAX«Магнит» запустил тестирование цифрового подтверждения возраста через мессенджер MAX«Магнит» запустил тестирование цифрового подтверждения возраста через мессенджер MAX

ГигаЧат: коротко о главном

«Магнит» запустил тестирование цифрового подтверждения возраста через мессенджер MAX

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Редакция рекомендует
Карьера
Блоги 417
Газпромбанк
OTP Bank
Т-Банк
X5 Tech
билайн
МТС
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы