Según un documento confidencial de OpenAI, la compañía ha "contratado a personas de diversas ocupaciones para ayudar a recopilar tareas del mundo real basadas en las que han realizado en sus trabajos a tiempo completo, para que podamos medir el rendimiento de los modelos de IA en esas tareas". El documento instruye a los contratistas a "tomar trabajos complejos o a largo plazo existentes (de horas o días) que hayan realizado en su ocupación y convertirlos en una tarea".
Esta iniciativa forma parte del esfuerzo más amplio de OpenAI para evaluar su progreso hacia el logro de la inteligencia artificial general (IAG). En septiembre, OpenAI lanzó un nuevo proceso de evaluación centrado en comparar el rendimiento de sus modelos de IA con el de profesionales humanos de diversos sectores. OpenAI define la IAG como un sistema de IA que supera las capacidades humanas en la mayoría de las tareas económicamente valiosas.
Los datos recopilados de estas tareas del mundo real se utilizarán para entrenar y perfeccionar los modelos de IA de OpenAI, permitiéndoles comprender y ejecutar mejor las tareas complejas. Al comparar el rendimiento de la IA con una base de referencia humana, OpenAI espera identificar las áreas en las que sus modelos sobresalen y las áreas que requieren una mayor mejora. Este enfoque es crucial para desarrollar sistemas de IA que puedan aumentar o incluso automatizar eficazmente diversas tareas profesionales.
Las implicaciones de lograr la IAG son de gran alcance, transformando potencialmente las industrias y remodelando la naturaleza del trabajo. Si bien el desarrollo de la IAG promete beneficios significativos, como el aumento de la productividad y la innovación, también plantea preocupaciones sobre el desplazamiento laboral y las consideraciones éticas de los sistemas de IA cada vez más autónomos. Los esfuerzos de OpenAI para comparar el rendimiento de la IA con las capacidades humanas son un paso hacia la comprensión y el abordaje de estos complejos problemas.
El estado actual del proyecto implica la recopilación y el análisis continuos de datos. OpenAI aún no ha publicado detalles específicos sobre el rendimiento de sus modelos en comparación con la base de referencia humana. Sin embargo, se espera que la compañía continúe perfeccionando su proceso de evaluación e incorporando nuevos datos a medida que avanza hacia su objetivo de lograr la IAG. Los próximos desarrollos probablemente incluirán nuevas iteraciones de los modelos de IA basadas en los datos recopilados y evaluaciones continuas de su rendimiento en una gama más amplia de tareas.
Discussion
Join the conversation
Be the first to comment