De acordo com um documento confidencial da OpenAI, a empresa "contratou pessoas de diversas ocupações para ajudar a coletar tarefas do mundo real modeladas a partir daquelas que você realizou em seus empregos de tempo integral, para que possamos medir o desempenho dos modelos de IA nessas tarefas". O documento instrui os contratados a "pegar partes existentes de trabalhos complexos ou de longo prazo (horas ou dias) que você realizou em sua ocupação e transformar cada um em uma tarefa".
Esta iniciativa faz parte do esforço mais amplo da OpenAI para avaliar seu progresso em direção à conquista da inteligência artificial geral (AGI). Em setembro, a OpenAI lançou um novo processo de avaliação focado em comparar o desempenho de seus modelos de IA com profissionais humanos em diversos setores. A OpenAI define AGI como um sistema de IA que supera as capacidades humanas na maioria das tarefas economicamente valiosas.
Os dados coletados dessas tarefas do mundo real serão usados para treinar e refinar os modelos de IA da OpenAI, permitindo que eles entendam e executem melhor tarefas complexas. Ao comparar o desempenho da IA com uma base de referência humana, a OpenAI espera identificar áreas onde seus modelos se destacam e áreas que exigem melhorias adicionais. Essa abordagem é crucial para desenvolver sistemas de IA que possam aumentar ou até mesmo automatizar várias tarefas profissionais de forma eficaz.
As implicações de alcançar a AGI são de longo alcance, potencialmente transformando indústrias e remodelando a natureza do trabalho. Embora o desenvolvimento da AGI prometa benefícios significativos, como aumento da produtividade e inovação, também levanta preocupações sobre o deslocamento de empregos e as considerações éticas de sistemas de IA cada vez mais autônomos. Os esforços da OpenAI para comparar o desempenho da IA com as capacidades humanas são um passo para entender e abordar essas questões complexas.
O status atual do projeto envolve coleta e análise de dados contínuas. A OpenAI ainda não divulgou detalhes específicos sobre o desempenho de seus modelos em relação à base de referência humana. No entanto, espera-se que a empresa continue refinando seu processo de avaliação e incorporando novos dados à medida que avança em direção ao seu objetivo de alcançar a AGI. Os próximos desenvolvimentos provavelmente incluirão mais iterações de modelos de IA com base nos dados coletados e avaliações contínuas de seu desempenho em uma gama mais ampla de tarefas.
Discussion
Join the conversation
Be the first to comment