Un juge du tribunal de district américain s'est prononcé contre OpenAI, contraignant l'entreprise à fournir aux organisations de presse l'accès à 20 millions de journaux de ChatGPT pour enquête sur la violation du droit d'auteur, et maintenant ces organisations demandent un accès supplémentaire à potentiellement des millions de conversations supprimées. Le juge Sidney Stein a rejeté les objections d'OpenAI à une ordonnance antérieure de la magistrate Ona Wang, qui avait déterminé que les intérêts de confidentialité des utilisateurs de ChatGPT étaient suffisamment équilibrés par rapport à la nécessité des journaux dans le litige.
OpenAI avait proposé une approche alternative où elle exécuterait des termes de recherche pour identifier les sorties potentiellement contrefaisantes dans les journaux, accordant aux plaignants de la presse l'accès uniquement aux conversations pertinentes. L'entreprise a fait valoir que cela serait moins lourd pour la confidentialité des utilisateurs. Cependant, le juge Stein a confirmé l'évaluation de la juge Wang selon laquelle la confidentialité des utilisateurs était suffisamment protégée dans l'ordonnance initiale, qui comprenait des mesures pour protéger l'identité des utilisateurs de ChatGPT. Les détails de ces mesures n'ont pas été précisés dans les documents disponibles.
Le problème central tourne autour de l'utilisation de matériel protégé par le droit d'auteur pour entraîner de grands modèles linguistiques (LLM) comme ChatGPT. Ces modèles apprennent en traitant de vastes quantités de données textuelles, y compris des livres, des articles et d'autres œuvres protégées par le droit d'auteur. Les organisations de presse soutiennent que la production de ChatGPT reproduit parfois directement ou paraphrase étroitement leur contenu protégé par le droit d'auteur, violant ainsi leur propriété intellectuelle. Cette bataille juridique met en évidence l'intersection complexe de l'IA, du droit d'auteur et de la confidentialité des utilisateurs.
Les organisations de presse font maintenant pression pour obtenir des sanctions contre OpenAI et exigent la récupération et le partage des conversations supprimées, qui, selon elles, pourraient contenir d'autres preuves de violation du droit d'auteur. On pensait auparavant que ces conversations supprimées étaient inaccessibles et hors du champ d'application du litige. Les plaignants soutiennent que l'accès à ces données est crucial pour comprendre pleinement dans quelle mesure ChatGPT s'appuie sur du matériel protégé par le droit d'auteur.
L'affaire soulève des questions plus larges sur les responsabilités éthiques et juridiques des développeurs d'IA. Les LLM sont entraînés sur des ensembles de données massifs extraits d'Internet, souvent sans l'autorisation explicite des détenteurs de droits d'auteur. Cette pratique a conduit à de nombreux procès et à des appels à une plus grande transparence dans les données d'entraînement de l'IA. L'issue de cette affaire pourrait créer un précédent pour de futurs litiges en matière de droit d'auteur impliquant du contenu généré par l'IA.
Les prochaines étapes du litige ne sont pas claires, mais OpenAI est maintenant contraint de produire les 20 millions de journaux de ChatGPT. Les organisations de presse analyseront ensuite ces données pour identifier les cas de violation potentielle du droit d'auteur. La bataille juridique devrait se poursuivre alors que les deux parties sont aux prises avec les questions juridiques et techniques complexes en jeu. L'affaire est toujours en cours devant le tribunal de district américain.
Discussion
Join the conversation
Be the first to comment