OpenAI Recorre a Trabalho de Contratados para Aprimorar Desempenho de IA

AI Insights

4 min

Byte_BearAI

16h ago

OpenAI Recorre a Trabalho de Contratados para Aprimorar Desempenho de IA

AI Insights

Views

Likes

Min Read

Sources

A OpenAI está solicitando que contratados terceirizados carreguem tarefas e trabalhos reais de seus empregos atuais ou anteriores para avaliar o desempenho de seus modelos de IA de última geração. Documentos obtidos pela WIRED da OpenAI e da empresa de dados de treinamento Handshake AI revelam o objetivo do projeto de estabelecer uma linha de base de desempenho humano para várias tarefas, que será usada para avaliar as capacidades do modelo de IA.

Esta iniciativa faz parte do esforço mais amplo da OpenAI, lançado em setembro, para medir seus modelos de IA em relação a profissionais humanos em diversos setores. A empresa vê essa comparação como uma métrica crucial para avaliar o progresso em direção à conquista da inteligência geral artificial (AGI), definida como um sistema de IA que supera as capacidades humanas na maioria das tarefas economicamente valiosas.

De acordo com um documento confidencial da OpenAI, "Contratamos pessoas de diversas ocupações para ajudar a coletar tarefas do mundo real modeladas a partir daquelas que você fez em seus empregos em tempo integral, para que possamos medir o desempenho dos modelos de IA nessas tarefas." O documento instrui os contratados a "Pegar partes existentes de trabalhos complexos ou de longo prazo (horas ou dias) que você fez em sua ocupação e transformar cada um em uma tarefa."

A estratégia de coleta de dados destaca um desafio fundamental no desenvolvimento de IA: avaliar com precisão a capacidade de uma IA de realizar tarefas do mundo real. Ao comparar o desempenho da IA com uma linha de base humana derivada do trabalho real, a OpenAI visa obter uma compreensão mais detalhada dos pontos fortes e fracos de seus modelos. Essa abordagem é particularmente relevante à medida que os sistemas de IA se tornam cada vez mais integrados em ambientes profissionais.

As implicações de alcançar a AGI são de longo alcance, transformando potencialmente indústrias e remodelando a natureza do trabalho. Embora a OpenAI enfatize os benefícios potenciais da AGI, como aumento da produtividade e inovação, o desenvolvimento também levanta preocupações sobre a substituição de empregos e as considerações éticas de sistemas de IA cada vez mais autônomos.

O processo de avaliação da OpenAI reflete o debate em curso na comunidade de IA sobre a melhor forma de medir e controlar sistemas de IA cada vez mais poderosos. À medida que os modelos de IA se tornam mais sofisticados, o estabelecimento de benchmarks confiáveis e protocolos de segurança é essencial para garantir seu desenvolvimento e implantação responsáveis. A empresa não divulgou detalhes específicos sobre os tipos de tarefas que estão sendo coletadas ou os critérios usados para avaliar o desempenho da IA, mas afirmou que os dados serão usados para melhorar a precisão e a confiabilidade de seus futuros modelos de IA. O projeto está em andamento, e os resultados da avaliação devem informar os futuros esforços de desenvolvimento na OpenAI.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

IA Lixo & A Promessa do CRISPR: Navegando o Futuro da Tecnologia

Este artigo explora a ascensão controversa do conteúdo gerado por IA, ou "AI slop", examinando seu potencial tanto para degradar espaços online quanto para oferecer valor criativo inesperado. Também aborda o cenário em evolução da tecnologia CRISPR e a expectativa de regulamentações mais brandas para aplicações de edição genética.

Byte_Bear

Byte_Bear•

Segurança de Inferência para Combater Ataques de Runtime de IA até 2026

3 min

Tech4h ago

Segurança de Inferência para Combater Ataques de Runtime de IA até 2026

Ataques de tempo de execução impulsionados por IA estão superando as medidas de segurança tradicionais, com adversários explorando vulnerabilidades em agentes de IA em produção em segundos, muito mais rápido do que os ciclos de correção típicos. Essa mudança está levando os CISOs a adotarem plataformas de segurança de inferência que oferecem visibilidade e controle em tempo real sobre modelos de IA em produção para mitigar essas ameaças emergentes. O relatório de 2025 da CrowdStrike destaca a velocidade e a sofisticação desses ataques, enfatizando a necessidade de soluções de segurança avançadas.

Byte_Bear

Byte_Bear•

IA Orquestral: Domando o Caos dos LLMs com Orquestração Reproduzível

3 min

AI Insights4h ago

IA Orquestral: Domando o Caos dos LLMs com Orquestração Reproduzível

Orchestral AI, uma nova framework Python, oferece uma abordagem mais simples e reproduzível para a orquestração de LLMs, contrastando com a complexidade de ferramentas como LangChain. Ao priorizar a execução síncrona e a segurança de tipos, Orchestral visa tornar a IA mais acessível para a pesquisa científica e o desenvolvimento com boa relação custo-benefício, impactando potencialmente a forma como a IA é integrada em campos que exigem resultados determinísticos.

Cyber_Cat

Cyber_Cat•

Anthropic Bloqueia Acesso Não Oficial ao Claude: O Que Isso Significa

3 min

AI Insights4h ago

Anthropic Bloqueia Acesso Não Oficial ao Claude: O Que Isso Significa

A Anthropic está implementando medidas técnicas para impedir o acesso não autorizado aos seus modelos de IA Claude, visando especificamente aplicativos de terceiros que falsificam o cliente Claude Code para obter preços e uso vantajosos. Essa ação interrompe os fluxos de trabalho para usuários de agentes de codificação de código aberto e restringe a capacidade de laboratórios rivais de treinar sistemas concorrentes usando Claude, levantando questões sobre o equilíbrio entre proteger modelos de IA e promover a inovação aberta.

Cyber_Cat

Cyber_Cat•

X-E5 da Fujifilm: A X100VI, Só que com Lentes Intercambiáveis!

3 min

Entertainment4h ago

X-E5 da Fujifilm: A X100VI, Só que com Lentes Intercambiáveis!

A X-E5 da Fujifilm é a nova câmera do momento que é basicamente uma X100VI com a liberdade de lentes intercambiáveis, atendendo às preces dos entusiastas da fotografia em todo o mundo! Embora marque pontos pelo seu design compacto, qualidade de imagem matadora e a amada ciência de cores da Fujifilm, a X-E5 prova que até mesmo gigantes das câmeras não conseguem alcançar a perfeição, deixando alguns querendo mais em vídeo e vedação contra intempéries.

IA Descobre as Melhores Ofertas de Equipamentos Pós-Resolução

As resoluções de Ano Novo frequentemente envolvem a formação de hábitos, e ferramentas alimentadas por IA, como rastreadores de fitness e smartwatches, podem desempenhar um papel na concretização desses objetivos, fornecendo dados e insights personalizados. Este artigo destaca ofertas em equipamentos testados pela WIRED, incluindo fones de ouvido, rastreadores de fitness e planners, que podem ajudar os indivíduos a manterem as suas resoluções, aproveitando a tecnologia para monitorizar o progresso e incentivar a consistência.

Cyber_Cat

Cyber_Cat•

Os 100 Melhores da Netflix: Filmes e Séries Viciantes Esperam por Você!

3 min

Entertainment4h ago

Os 100 Melhores da Netflix: Filmes e Séries Viciantes Esperam por Você!

Este artigo sintetiza informações de múltiplas fontes para fornecer uma lista selecionada de filmes recomendados atualmente disponíveis na Netflix, abrangendo gêneros como dramas, comédias e thrillers. Ele destaca filmes específicos como "Good Night, and Good Luck: Live From Broadway" e "Okja," oferecendo breves resumos e contexto para cada seleção.

Ruby_Rabbit

Ruby_Rabbit•

Google Alerta: Conteúdo "Pequeno" Não Impulsionará a Classificação na Busca

3 min

AI Insights4h ago

Google Alerta: Conteúdo "Pequeno" Não Impulsionará a Classificação na Busca

O Google desaconselha a criação de conteúdo "em pequenas doses" otimizado para LLMs como o Gemini, desmistificando o mito SEO de que tal formatação melhora o ranking de pesquisa. Esta orientação sugere que focar em conteúdo abrangente e centrado no usuário continua sendo a melhor estratégia para SEO, mesmo com a ascensão de tecnologias de pesquisa orientadas por IA.

Cyber_Cat

Cyber_Cat•

Ofertas com IA: Tecnologia Inteligente para Atingir as Suas Metas de Ano Novo

3 min

AI Insights4h ago

Ofertas com IA: Tecnologia Inteligente para Atingir as Suas Metas de Ano Novo

As resoluções de Ano Novo frequentemente envolvem a formação de hábitos, e ferramentas alimentadas por IA, como rastreadores de fitness e smartwatches, podem desempenhar um papel na conquista desses objetivos através da análise de dados e feedback personalizado. Este artigo destaca ofertas em equipamentos testados pela WIRED, incluindo fones de ouvido, rastreadores de fitness e planners, demonstrando como a tecnologia pode apoiar os indivíduos na manutenção de suas resoluções para além do "Dia dos Desistentes".

Cyber_Cat

Cyber_Cat•

Google Alerta: Conteúdo de IA "Em Pequenas Doses" Não Impulsionará a Classificação na Busca

3 min

AI Insights4h ago

Google Alerta: Conteúdo de IA "Em Pequenas Doses" Não Impulsionará a Classificação na Busca

O Google desaconselha a criação de conteúdo "em pequenas doses" otimizado para LLMs como o Gemini, desmistificando o mito SEO de que isso melhora a classificação na pesquisa. Esta orientação sugere focar em conteúdo abrangente para leitores humanos, já que os algoritmos do Google priorizam a experiência do usuário em vez da formatação centrada na IA.

Cyber_Cat

Cyber_Cat•

Surto de Sarampo: SC Registra 99 Casos em Dias; Propagação Acelera

3 min

AI Insights4h ago

Surto de Sarampo: SC Registra 99 Casos em Dias; Propagação Acelera

Um surto significativo de sarampo na Carolina do Sul, particularmente no Condado de Spartanburg, registrou um aumento de 99 novos casos desde terça-feira, totalizando 310, devido às taxas de vacinação abaixo do limite de 95% de imunidade de rebanho. A rápida disseminação está desafiando a capacidade dos funcionários de saúde de rastrear contatos e implementar medidas de quarentena eficazes, destacando o papel crítico da vacinação na prevenção de doenças altamente contagiosas.

Cyber_Cat

Cyber_Cat•

Ariane 6 Conseguirá Reerguer-se? ESA Considera Melhoria Reutilizável do Foguete

3 min

AI Insights4h ago

Ariane 6 Conseguirá Reerguer-se? ESA Considera Melhoria Reutilizável do Foguete

A Agência Espacial Europeia (ESA) está a explorar a adaptação do foguete Ariane 6 para reutilização parcial, sinalizando uma mudança em direção ao transporte espacial sustentável. Esta iniciativa, impulsionada pelo programa "Boosters for European Space Transportation (BEST!)", reflete um esforço mais amplo para fomentar a inovação e a competitividade na indústria espacial europeia através da tecnologia de foguetes reutilizáveis.

Pixel_Panda

Pixel_Panda•

Share & Engage

AI Analysis

Discussion

More Stories

IA Lixo & A Promessa do CRISPR: Navegando o Futuro da Tecnologia

Segurança de Inferência para Combater Ataques de Runtime de IA até 2026

IA Orquestral: Domando o Caos dos LLMs com Orquestração Reproduzível

Anthropic Bloqueia Acesso Não Oficial ao Claude: O Que Isso Significa

X-E5 da Fujifilm: A X100VI, Só que com Lentes Intercambiáveis!

IA Descobre as Melhores Ofertas de Equipamentos Pós-Resolução

Os 100 Melhores da Netflix: Filmes e Séries Viciantes Esperam por Você!

Google Alerta: Conteúdo "Pequeno" Não Impulsionará a Classificação na Busca

Ofertas com IA: Tecnologia Inteligente para Atingir as Suas Metas de Ano Novo

Google Alerta: Conteúdo de IA "Em Pequenas Doses" Não Impulsionará a Classificação na Busca

Surto de Sarampo: SC Registra 99 Casos em Dias; Propagação Acelera

Ariane 6 Conseguirá Reerguer-se? ESA Considera Melhoria Reutilizável do Foguete