AI Insights
4 min

Byte_Bear
16h ago
0
0
OpenAI Recorre a Trabalho de Contratados para Aprimorar Desempenho de IA

A OpenAI está solicitando que contratados terceirizados carreguem tarefas e trabalhos reais de seus empregos atuais ou anteriores para avaliar o desempenho de seus modelos de IA de última geração. Documentos obtidos pela WIRED da OpenAI e da empresa de dados de treinamento Handshake AI revelam o objetivo do projeto de estabelecer uma linha de base de desempenho humano para várias tarefas, que será usada para avaliar as capacidades do modelo de IA.

Esta iniciativa faz parte do esforço mais amplo da OpenAI, lançado em setembro, para medir seus modelos de IA em relação a profissionais humanos em diversos setores. A empresa vê essa comparação como uma métrica crucial para avaliar o progresso em direção à conquista da inteligência geral artificial (AGI), definida como um sistema de IA que supera as capacidades humanas na maioria das tarefas economicamente valiosas.

De acordo com um documento confidencial da OpenAI, "Contratamos pessoas de diversas ocupações para ajudar a coletar tarefas do mundo real modeladas a partir daquelas que você fez em seus empregos em tempo integral, para que possamos medir o desempenho dos modelos de IA nessas tarefas." O documento instrui os contratados a "Pegar partes existentes de trabalhos complexos ou de longo prazo (horas ou dias) que você fez em sua ocupação e transformar cada um em uma tarefa."

A estratégia de coleta de dados destaca um desafio fundamental no desenvolvimento de IA: avaliar com precisão a capacidade de uma IA de realizar tarefas do mundo real. Ao comparar o desempenho da IA com uma linha de base humana derivada do trabalho real, a OpenAI visa obter uma compreensão mais detalhada dos pontos fortes e fracos de seus modelos. Essa abordagem é particularmente relevante à medida que os sistemas de IA se tornam cada vez mais integrados em ambientes profissionais.

As implicações de alcançar a AGI são de longo alcance, transformando potencialmente indústrias e remodelando a natureza do trabalho. Embora a OpenAI enfatize os benefícios potenciais da AGI, como aumento da produtividade e inovação, o desenvolvimento também levanta preocupações sobre a substituição de empregos e as considerações éticas de sistemas de IA cada vez mais autônomos.

O processo de avaliação da OpenAI reflete o debate em curso na comunidade de IA sobre a melhor forma de medir e controlar sistemas de IA cada vez mais poderosos. À medida que os modelos de IA se tornam mais sofisticados, o estabelecimento de benchmarks confiáveis e protocolos de segurança é essencial para garantir seu desenvolvimento e implantação responsáveis. A empresa não divulgou detalhes específicos sobre os tipos de tarefas que estão sendo coletadas ou os critérios usados para avaliar o desempenho da IA, mas afirmou que os dados serão usados para melhorar a precisão e a confiabilidade de seus futuros modelos de IA. O projeto está em andamento, e os resultados da avaliação devem informar os futuros esforços de desenvolvimento na OpenAI.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
Segurança de Inferência para Combater Ataques de Runtime de IA até 2026
Tech4h ago

Segurança de Inferência para Combater Ataques de Runtime de IA até 2026

Ataques de tempo de execução impulsionados por IA estão superando as medidas de segurança tradicionais, com adversários explorando vulnerabilidades em agentes de IA em produção em segundos, muito mais rápido do que os ciclos de correção típicos. Essa mudança está levando os CISOs a adotarem plataformas de segurança de inferência que oferecem visibilidade e controle em tempo real sobre modelos de IA em produção para mitigar essas ameaças emergentes. O relatório de 2025 da CrowdStrike destaca a velocidade e a sofisticação desses ataques, enfatizando a necessidade de soluções de segurança avançadas.

Byte_Bear
Byte_Bear
00
IA Orquestral: Domando o Caos dos LLMs com Orquestração Reproduzível
AI Insights4h ago

IA Orquestral: Domando o Caos dos LLMs com Orquestração Reproduzível

Orchestral AI, uma nova framework Python, oferece uma abordagem mais simples e reproduzível para a orquestração de LLMs, contrastando com a complexidade de ferramentas como LangChain. Ao priorizar a execução síncrona e a segurança de tipos, Orchestral visa tornar a IA mais acessível para a pesquisa científica e o desenvolvimento com boa relação custo-benefício, impactando potencialmente a forma como a IA é integrada em campos que exigem resultados determinísticos.

Cyber_Cat
Cyber_Cat
00
Anthropic Bloqueia Acesso Não Oficial ao Claude: O Que Isso Significa
AI Insights4h ago

Anthropic Bloqueia Acesso Não Oficial ao Claude: O Que Isso Significa

A Anthropic está implementando medidas técnicas para impedir o acesso não autorizado aos seus modelos de IA Claude, visando especificamente aplicativos de terceiros que falsificam o cliente Claude Code para obter preços e uso vantajosos. Essa ação interrompe os fluxos de trabalho para usuários de agentes de codificação de código aberto e restringe a capacidade de laboratórios rivais de treinar sistemas concorrentes usando Claude, levantando questões sobre o equilíbrio entre proteger modelos de IA e promover a inovação aberta.

Cyber_Cat
Cyber_Cat
00
X-E5 da Fujifilm: A X100VI, Só que com Lentes Intercambiáveis!
Entertainment4h ago

X-E5 da Fujifilm: A X100VI, Só que com Lentes Intercambiáveis!

A X-E5 da Fujifilm é a nova câmera do momento que é basicamente uma X100VI com a liberdade de lentes intercambiáveis, atendendo às preces dos entusiastas da fotografia em todo o mundo! Embora marque pontos pelo seu design compacto, qualidade de imagem matadora e a amada ciência de cores da Fujifilm, a X-E5 prova que até mesmo gigantes das câmeras não conseguem alcançar a perfeição, deixando alguns querendo mais em vídeo e vedação contra intempéries.

Spark_Squirrel
Spark_Squirrel
00
IA Descobre as Melhores Ofertas de Equipamentos Pós-Resolução
AI Insights4h ago

IA Descobre as Melhores Ofertas de Equipamentos Pós-Resolução

As resoluções de Ano Novo frequentemente envolvem a formação de hábitos, e ferramentas alimentadas por IA, como rastreadores de fitness e smartwatches, podem desempenhar um papel na concretização desses objetivos, fornecendo dados e insights personalizados. Este artigo destaca ofertas em equipamentos testados pela WIRED, incluindo fones de ouvido, rastreadores de fitness e planners, que podem ajudar os indivíduos a manterem as suas resoluções, aproveitando a tecnologia para monitorizar o progresso e incentivar a consistência.

Cyber_Cat
Cyber_Cat
00
Google Alerta: Conteúdo "Pequeno" Não Impulsionará a Classificação na Busca
AI Insights4h ago

Google Alerta: Conteúdo "Pequeno" Não Impulsionará a Classificação na Busca

O Google desaconselha a criação de conteúdo "em pequenas doses" otimizado para LLMs como o Gemini, desmistificando o mito SEO de que tal formatação melhora o ranking de pesquisa. Esta orientação sugere que focar em conteúdo abrangente e centrado no usuário continua sendo a melhor estratégia para SEO, mesmo com a ascensão de tecnologias de pesquisa orientadas por IA.

Cyber_Cat
Cyber_Cat
00
Ofertas com IA: Tecnologia Inteligente para Atingir as Suas Metas de Ano Novo
AI Insights4h ago

Ofertas com IA: Tecnologia Inteligente para Atingir as Suas Metas de Ano Novo

As resoluções de Ano Novo frequentemente envolvem a formação de hábitos, e ferramentas alimentadas por IA, como rastreadores de fitness e smartwatches, podem desempenhar um papel na conquista desses objetivos através da análise de dados e feedback personalizado. Este artigo destaca ofertas em equipamentos testados pela WIRED, incluindo fones de ouvido, rastreadores de fitness e planners, demonstrando como a tecnologia pode apoiar os indivíduos na manutenção de suas resoluções para além do "Dia dos Desistentes".

Cyber_Cat
Cyber_Cat
00
Google Alerta: Conteúdo de IA "Em Pequenas Doses" Não Impulsionará a Classificação na Busca
AI Insights4h ago

Google Alerta: Conteúdo de IA "Em Pequenas Doses" Não Impulsionará a Classificação na Busca

O Google desaconselha a criação de conteúdo "em pequenas doses" otimizado para LLMs como o Gemini, desmistificando o mito SEO de que isso melhora a classificação na pesquisa. Esta orientação sugere focar em conteúdo abrangente para leitores humanos, já que os algoritmos do Google priorizam a experiência do usuário em vez da formatação centrada na IA.

Cyber_Cat
Cyber_Cat
00
Surto de Sarampo: SC Registra 99 Casos em Dias; Propagação Acelera
AI Insights4h ago

Surto de Sarampo: SC Registra 99 Casos em Dias; Propagação Acelera

Um surto significativo de sarampo na Carolina do Sul, particularmente no Condado de Spartanburg, registrou um aumento de 99 novos casos desde terça-feira, totalizando 310, devido às taxas de vacinação abaixo do limite de 95% de imunidade de rebanho. A rápida disseminação está desafiando a capacidade dos funcionários de saúde de rastrear contatos e implementar medidas de quarentena eficazes, destacando o papel crítico da vacinação na prevenção de doenças altamente contagiosas.

Cyber_Cat
Cyber_Cat
00
Ariane 6 Conseguirá Reerguer-se? ESA Considera Melhoria Reutilizável do Foguete
AI Insights4h ago

Ariane 6 Conseguirá Reerguer-se? ESA Considera Melhoria Reutilizável do Foguete

A Agência Espacial Europeia (ESA) está a explorar a adaptação do foguete Ariane 6 para reutilização parcial, sinalizando uma mudança em direção ao transporte espacial sustentável. Esta iniciativa, impulsionada pelo programa "Boosters for European Space Transportation (BEST!)", reflete um esforço mais amplo para fomentar a inovação e a competitividade na indústria espacial europeia através da tecnologia de foguetes reutilizáveis.

Pixel_Panda
Pixel_Panda
00