Окружной судья США вынес решение против OpenAI, обязав компанию предоставить новостным организациям доступ к 20 миллионам логов ChatGPT для расследования нарушений авторских прав, и теперь эти организации добиваются дальнейшего доступа к потенциально миллионам удаленных чатов. Судья Сидни Стайн отклонил возражения OpenAI против предыдущего постановления магистрата Оны Ванг, которая определила, что интересы конфиденциальности пользователей ChatGPT были адекватно сбалансированы с необходимостью получения логов в рамках судебного разбирательства.
OpenAI предложила альтернативный подход, при котором она будет использовать поисковые запросы для выявления потенциально нарушающих авторские права результатов в логах, предоставляя новостным истцам доступ только к соответствующим чатам. Компания утверждала, что это будет менее обременительно для конфиденциальности пользователей. Однако судья Стайн поддержал оценку судьи Ванг о том, что конфиденциальность пользователей была достаточно защищена в первоначальном постановлении, которое включало меры по защите личности пользователей ChatGPT. Подробности этих мер не были указаны в доступных документах.
Основной вопрос заключается в использовании материалов, защищенных авторским правом, для обучения больших языковых моделей (LLM), таких как ChatGPT. Эти модели обучаются путем обработки огромных объемов текстовых данных, включая книги, статьи и другие произведения, защищенные авторским правом. Новостные организации утверждают, что выходные данные ChatGPT иногда напрямую воспроизводят или близко перефразируют их контент, защищенный авторским правом, тем самым нарушая их интеллектуальную собственность. Эта судебная тяжба подчеркивает сложную взаимосвязь между ИИ, законом об авторском праве и конфиденциальностью пользователей.
В настоящее время новостные организации настаивают на применении санкций против OpenAI и требуют восстановления и передачи удаленных чатов, которые, по их мнению, могут содержать дополнительные доказательства нарушения авторских прав. Ранее считалось, что эти удаленные чаты недоступны и находятся за пределами судебного разбирательства. Истцы утверждают, что доступ к этим данным имеет решающее значение для полного понимания того, в какой степени ChatGPT полагается на материалы, защищенные авторским правом.
Дело поднимает более широкие вопросы об этической и юридической ответственности разработчиков ИИ. LLM обучаются на массивных наборах данных, собранных из Интернета, часто без явного разрешения правообладателей. Эта практика привела к многочисленным судебным искам и призывам к большей прозрачности в данных для обучения ИИ. Исход этого дела может создать прецедент для будущих споров об авторских правах, связанных с контентом, сгенерированным ИИ.
Следующие шаги в судебном разбирательстве неясны, но OpenAI теперь обязана предоставить 20 миллионов логов ChatGPT. Затем новостные организации проанализируют эти данные для выявления случаев потенциального нарушения авторских прав. Ожидается, что судебная тяжба продолжится, поскольку обе стороны борются со сложными юридическими и техническими вопросами, стоящими на кону. Дело остается на рассмотрении в Окружном суде США.
Discussion
Join the conversation
Be the first to comment