Ce projet s'inscrit dans la stratégie plus large d'OpenAI visant à mesurer ses modèles d'IA par rapport aux professionnels humains dans divers domaines. En septembre, OpenAI a lancé un nouveau processus d'évaluation destiné à évaluer les performances de l'IA par rapport à l'expertise humaine. L'entreprise considère cette comparaison comme une mesure cruciale dans sa quête d'une intelligence artificielle générale (IAG), définie comme un système d'IA capable de surpasser les capacités humaines dans la plupart des tâches économiquement intéressantes.
Un document confidentiel d'OpenAI indiquait : « Nous avons embauché des personnes de différents métiers pour nous aider à collecter des tâches réelles calquées sur celles que vous avez effectuées dans le cadre de votre emploi à temps plein, afin de pouvoir mesurer les performances des modèles d'IA sur ces tâches. Prenez des éléments existants de travaux complexes ou de longue haleine (heures ou jours) que vous avez effectués dans votre profession et transformez chacun d'eux en une tâche. »
L'effort de collecte de données soulève des questions concernant la propriété intellectuelle et la confidentialité des données. Bien qu'OpenAI n'ait pas commenté publiquement les mesures spécifiques prises pour répondre à ces préoccupations, les documents internes de l'entreprise suggèrent une prise de conscience de la nécessité de traiter les informations sensibles de manière responsable. L'initiative souligne également la demande croissante de données d'entraînement de haute qualité dans l'industrie de l'IA, où les performances des modèles d'IA dépendent fortement des données sur lesquelles ils sont entraînés.
Cette démarche reflète une tendance plus large dans le développement de l'IA, où les entreprises se concentrent de plus en plus sur la création de systèmes d'IA capables d'effectuer des tâches complexes et réelles. En comparant les performances de l'IA aux références humaines, OpenAI vise à identifier les domaines dans lesquels ses modèles excellent et ceux dans lesquels des améliorations supplémentaires sont nécessaires. Cette approche vise à accélérer le développement de systèmes d'IA plus performants et plus fiables.
Le processus d'évaluation pourrait avoir des implications importantes pour l'avenir du travail. À mesure que les modèles d'IA deviennent plus compétents dans l'exécution de tâches actuellement effectuées par des humains, cela pourrait entraîner une automatisation dans divers secteurs. Cependant, OpenAI souligne que son objectif n'est pas de remplacer les travailleurs humains, mais de créer des systèmes d'IA capables d'augmenter les capacités humaines et d'améliorer la productivité. L'entreprise n'a pas encore publié de résultats spécifiques de son processus d'évaluation, mais elle devrait partager des mises à jour sur ses progrès dans les mois à venir.
Discussion
Join the conversation
Be the first to comment