Nvidia могла використовувати захищений авторським правом контент YouTube, Netflix та інших джерел для навчання свого штучного інтелекту, з’ясували журналісти 404 Media, у розпорядження яких потрапили документи та внутрішні чати зі Slack.

Згідно з цими даними, компанія просила працівників завантажувати відео з YouTube, Netflix, бази даних кінотрейлерів MovieNet, внутрішніх бібліотек відеоігор і наборів відеоданих Github WebVid (зараз видалений) та InternVid-10M, що містить 10 мільйонів ідентифікаторів відео з YouTube.

Деякі з цих даних мали позначення придатних тільки для академічного або іншого некомерційного використання. За інформацією журналістів, Nvidia використовувала ці відео для розробки комерційних ШІ-проєктів: генератора 3D-світу Omniverse, самокерованих автомобільних систем і віртуальних асистентів Digital Human.

Дехто з працівників компанії висловили етичні та юридичні занепокоєння через цю практику, але керівники, йдеться в отриманих журналістами документах, відповіли їм, що отримали «зелене світло» на найвищому рівні компанії.

Аби YouTube не дізнався про таку практику, Nvidia начебто завантажувала контент за допомогою віртуальних машин зі змінними IP-адресами.

Що кажуть у Nvidia та YouTube

У відповідь на запит порталу Engadget Nvidia почала захищати цю практику, стверджуючи, що такі дослідження не порушують закони. І прирівняла подібне використання контенту до права людини вивчати факти, ідеї, дані або інформацію з іншого джерела. У YouTube же відповіли, що використання відео платформи для навчання штучного інтелекту — це явне порушення їхніх умов.

Нагадаємо, нещодавно стало відомо, що Apple, NVIDIA та Anthropic навчали ШІ-моделі на стенограмах YouTube без дозволу. Наразі компанії, що займаються розробкою ШІ, не надають прозорої інформації щодо даних, які використовуються для навчання їхніх моделей. На початку цього місяця художники та фотографи критикували Apple, що вона не розкриває джерел навчальних даних для Apple Intelligence, власної розробки компанії в галузі генеративного ШІ, яка цього року з’явиться на мільйонах пристроїв Apple.