Отчет: Apple без разрешения обучила свой искусственный интеллект транскриптам YouTube

а Расследование Proof News Некоторые крупнейшие мировые технологические компании, в том числе Apple и Nvidia, утверждают, что обучают системы искусственного интеллекта, используя расшифровки видеороликов YouTube без разрешения создателей.

Отчет о том, что Включает инструмент поиска Чтобы определить, был ли канал YouTube в наборе данных, говорится, что «субтитры из 173 536 видеороликов YouTube, взятых из более чем 48 000 каналов, использовались тяжеловесами Кремниевой долины, включая Anthropic, Nvidia, Apple и Salesforce». Некоторые из каналов YouTube, включенных в набор данных, представляют собой ночные шоу, такие как «Позднее шоу со Стивеном Колбертом и Джимми Киммелом в прямом эфире», а также контент популярных личностей YouTube, в том числе Мистер БестТехнические ссылки Маркиз Браунли И PewDiePie.

Proof News сообщила, что набор данных был частью группы Pile, принадлежащей некоммерческой организации. Элеутера. в Исследовательская работа 2020 г.Некоммерческая организация описала кучу как содержащую 22 отдельных набора данных.

Apple, Anthropic и EleutherAI не сразу ответили на запросы о комментариях, а Nvidia отказалась от комментариев.

В электронном письме CNET представитель Google заявил, что компания придерживается своих предыдущих заявлений по этому вопросу, связывая их с… Статья Bloomberg за апрельВ статье генеральный директор Google Нил Мохан сказал, что он не знает, действительно ли OpenAI использовал видео YouTube для обучения генератора преобразования текста в видео, но если бы это было так, это было бы нарушением условий обслуживания платформы. Он не уточнил, использовал ли Google видео таким образом.

Арт-значок от AI Atlas Художественный значок от AI Atlas

Хотя искусственный интеллект остается основной технологией, которую разрабатывают такие технологические гиганты, как Apple, Google, Microsoft, Meta и IBM, разработка этой технологии требует подачи в модели искусственного интеллекта огромных объемов данных. Лидеры отрасли, включая OpenAI, признают, что это становится все сложнее. Становится все труднее найти наборы данных для обучения систем искусственного интеллекта.Это побудило OpenAI, создателя ChatGPT, заключить сделки с контент-компаниями, в том числе… Новости Корпорации И Reddit, чтобы получать контент для систем искусственного интеллекта.

Однако информация в отчете предполагает, что технологические компании, такие как Apple и Nvidia, могут поглощать наборы данных, содержащие информацию, которая не соответствует, по крайней мере по духу, тому, что создатели контента ожидают от такой платформы, как YouTube. Что видимо запрещено Извлекайте данные из видеоклипов или стенограмм видео.

Представитель Anthropic, стартапа в области искусственного интеллекта, работающего на благо общества, рассказал Proof News, что компания использует Pile для обучения своего помощника по искусственному интеллекту Клода, добавив: «Pile включает в себя очень небольшую часть переводов YouTube».

Представитель YouTube Дженнифер Мартинес заявила: «Условия YouTube распространяются на прямое использование его платформы, что отличается от использования набора данных The Pile. В случае потенциальных нарушений условий обслуживания YouTube мы должны направить вас к авторам The Pile».

И, как отмечается в отчете, сама Google Его обвинили в скрапинге контента с YouTubeКомпания сообщила New York Times, что ее соглашение с создателями контента позволяет использовать контент YouTube для обучения искусственному интеллекту.

Читайте на 123ru.net