Selon un article de Wired, OpenAI et la société de données d'entraînement Handshake AI demanderaient à des contractuels tiers de télécharger des travaux réels effectués dans le cadre de leurs fonctions antérieures et actuelles. Cette initiative semble s'inscrire dans une stratégie plus large des entreprises d'IA visant à tirer parti des contractuels pour générer des données d'entraînement de haute qualité, dans le but ultime d'automatiser davantage de tâches administratives.
Selon l'article, les instructions d'OpenAI aux contractuels consistent à détailler les tâches effectuées dans d'autres emplois et à fournir des exemples concrets de résultats de travail, tels que des documents Word, des PDF, des présentations PowerPoint, des fichiers Excel, des images et des référentiels de code. Les contractuels sont tenus de supprimer les informations exclusives et personnelles identifiables avant de télécharger ces fichiers, et OpenAI leur donne accès à un "outil de nettoyage ChatGPT Superstar" pour les aider dans ce processus.
Cette pratique soulève des inquiétudes quant aux droits de propriété intellectuelle. Evan Brown, un avocat spécialisé dans la propriété intellectuelle, a déclaré à Wired que cette approche comporte un risque important pour les laboratoires d'IA, car elle repose fortement sur la fiabilité des contractuels pour nettoyer correctement les données sensibles.
La recherche de données d'entraînement de haute qualité est motivée par la sophistication croissante des modèles d'IA. Ces modèles, en particulier les grands modèles linguistiques (LLM) comme la série GPT d'OpenAI, nécessitent de grandes quantités de données pour apprendre et effectuer des tâches efficacement. La qualité de ces données est cruciale ; des données de meilleure qualité conduisent à des systèmes d'IA plus précis et plus fiables. En utilisant des exemples concrets de travaux réalisés, les entreprises d'IA espèrent former des modèles capables d'automatiser plus efficacement des tâches complexes fondées sur la connaissance.
Les implications de l'automatisation du travail administratif sont considérables. Si les partisans soutiennent que l'IA peut accroître l'efficacité et la productivité, les critiques s'inquiètent des suppressions d'emplois et du risque d'aggravation des inégalités économiques. Le débat porte sur la question de savoir si l'IA augmentera les capacités humaines ou les remplacera entièrement dans de nombreux rôles professionnels.
L'état actuel de l'initiative d'OpenAI reste quelque peu flou. On ne sait pas combien de contractuels y participent ni quels sont les types de travaux spécifiques collectés. L'impact à long terme de cet effort de collecte de données sur les modèles d'OpenAI et le paysage plus large de l'IA reste à voir. Les développements futurs dépendront probablement des considérations juridiques et éthiques entourant la confidentialité des données et la propriété intellectuelle, ainsi que de l'évolution des capacités de la technologie de l'IA.
Discussion
Join the conversation
Be the first to comment