Selon un rapport de Wired, OpenAI et la société de données d'entraînement Handshake AI demanderaient à des contractuels tiers de télécharger des travaux réels effectués dans des rôles passés et actuels. Cette initiative semble s'inscrire dans une stratégie plus large des entreprises d'IA visant à tirer parti des contractuels pour générer des données d'entraînement de haute qualité, dans le but ultime d'automatiser davantage de tâches administratives.
Selon le rapport de Wired, la présentation interne d'OpenAI demanderait aux contractuels de détailler les tâches effectuées lors d'emplois précédents et de fournir des exemples concrets de travail, tels que des documents Word, des PDF, des présentations PowerPoint, des feuilles Excel, des images ou des référentiels de code. L'entreprise conseillerait aux contractuels de supprimer les informations exclusives et les données personnelles identifiables avant de les télécharger, en offrant un "outil de nettoyage ChatGPT Superstar" à cet effet.
Cette approche soulève d'importantes préoccupations en matière de propriété intellectuelle. Evan Brown, un avocat spécialisé dans la propriété intellectuelle, a déclaré à Wired que tout laboratoire d'IA adoptant cette méthode court un risque considérable, car il repose fortement sur la fiabilité de ses contractuels. La préoccupation découle du risque que les contractuels téléchargent par inadvertance ou délibérément du matériel protégé par le droit d'auteur ou confidentiel, qui pourrait ensuite être intégré dans les modèles d'IA.
Les données téléchargées par les contractuels sont destinées à entraîner les modèles d'IA, leur permettant de mieux comprendre et de reproduire les processus de travail humains. Ce processus implique de fournir aux modèles de vastes quantités de données, leur permettant d'identifier les schémas et les relations au sein de l'information. L'objectif est de créer des systèmes d'IA capables d'effectuer des tâches complexes avec une intervention humaine minimale.
L'utilisation d'exemples concrets est considérée comme cruciale pour développer des modèles d'IA capables d'automatiser avec précision et efficacité les emplois de bureau. En s'entraînant sur des échantillons de travail authentiques, les systèmes d'IA peuvent apprendre à gérer les nuances et les complexités de diverses tâches professionnelles. Cependant, les implications éthiques et juridiques de l'utilisation de telles données restent un sujet de débat permanent.
Actuellement, on ne sait pas clairement comment OpenAI prévoit d'utiliser les données téléchargées et quelles sont les mesures de protection en place pour prévenir l'utilisation abusive ou la violation du droit d'auteur. L'entreprise n'a pas encore publié de déclaration officielle concernant le rapport. La situation met en évidence les défis et les complexités liés à l'approvisionnement et à l'utilisation des données pour l'entraînement de l'IA, en particulier lorsqu'il s'agit d'informations sensibles ou exclusives. Les développements seront probablement suivis de près par les experts juridiques et les observateurs de l'industrie.
Discussion
Join the conversation
Be the first to comment