Um juiz do Tribunal Distrital dos EUA decidiu contra a OpenAI, obrigando a empresa a fornecer a organizações de notícias acesso a 20 milhões de logs do ChatGPT para investigação de violação de direitos autorais, e agora essas organizações estão buscando acesso adicional a potencialmente milhões de chats excluídos. O juiz Sidney Stein rejeitou as objeções da OpenAI a uma ordem anterior da juíza magistrada Ona Wang, que determinou que os interesses de privacidade dos usuários do ChatGPT foram adequadamente equilibrados em relação à necessidade dos logs no litígio.
A OpenAI havia proposto uma abordagem alternativa, na qual executaria termos de pesquisa para identificar resultados potencialmente infratores nos logs, concedendo aos autores das ações judiciais de notícias acesso apenas aos chats relevantes. A empresa argumentou que isso seria menos oneroso para a privacidade do usuário. No entanto, o juiz Stein manteve a avaliação da juíza Wang de que a privacidade do usuário estava suficientemente protegida na ordem original, que incluía medidas para proteger as identidades dos usuários do ChatGPT. Os detalhes dessas medidas não foram detalhados nos documentos disponíveis.
A questão central gira em torno do uso de material protegido por direitos autorais para treinar grandes modelos de linguagem (LLMs) como o ChatGPT. Esses modelos aprendem processando grandes quantidades de dados de texto, incluindo livros, artigos e outras obras protegidas por direitos autorais. As organizações de notícias argumentam que a saída do ChatGPT às vezes replica diretamente ou parafraseia de perto seu conteúdo protegido por direitos autorais, infringindo assim sua propriedade intelectual. Esta batalha legal destaca a complexa interseção de IA, lei de direitos autorais e privacidade do usuário.
As organizações de notícias estão agora pressionando por sanções contra a OpenAI e exigindo a recuperação e o compartilhamento de chats excluídos, que acreditam que podem conter mais evidências de violação de direitos autorais. Esses chats excluídos eram anteriormente considerados inacessíveis e fora do escopo do litígio. Os autores argumentam que o acesso a esses dados é crucial para entender completamente a extensão em que o ChatGPT depende de material protegido por direitos autorais.
O caso levanta questões mais amplas sobre as responsabilidades éticas e legais dos desenvolvedores de IA. Os LLMs são treinados em conjuntos de dados massivos extraídos da internet, muitas vezes sem permissão explícita dos detentores de direitos autorais. Essa prática levou a inúmeras ações judiciais e pedidos de maior transparência nos dados de treinamento de IA. O resultado deste caso pode estabelecer um precedente para futuras disputas de direitos autorais envolvendo conteúdo gerado por IA.
As próximas etapas do litígio não são claras, mas a OpenAI agora é obrigada a produzir os 20 milhões de logs do ChatGPT. As organizações de notícias analisarão então esses dados para identificar instâncias de potencial violação de direitos autorais. Espera-se que a batalha legal continue enquanto ambos os lados lidam com as complexas questões legais e técnicas em jogo. O caso permanece em andamento no Tribunal Distrital dos EUA.
Discussion
Join the conversation
Be the first to comment