A OpenAI e a empresa de dados de treinamento Handshake AI estão, segundo relatos, solicitando que contratados terceirizados carreguem trabalhos reais concluídos em funções passadas e atuais, de acordo com uma reportagem da Wired. A iniciativa parece fazer parte de uma estratégia mais ampla entre as empresas de IA para alavancar contratados na geração de dados de treinamento de alta qualidade, com o objetivo final de automatizar mais tarefas de escritório.
De acordo com a reportagem da Wired, a apresentação interna da OpenAI supostamente instrui os contratados a detalhar as tarefas realizadas em empregos anteriores e a fornecer exemplos tangíveis de trabalho, como documentos do Word, PDFs, apresentações do PowerPoint, planilhas do Excel, imagens ou repositórios de código. A empresa supostamente aconselha os contratados a remover informações proprietárias e dados de identificação pessoal antes de fazer o upload, oferecendo uma "ferramenta de limpeza ChatGPT Superstar" para esse fim.
Essa abordagem levanta preocupações significativas sobre propriedade intelectual. Evan Brown, um advogado de propriedade intelectual, disse à Wired que qualquer laboratório de IA que adote esse método enfrenta um risco considerável, pois depende fortemente da confiabilidade de seus contratados. A preocupação decorre do potencial de os contratados carregarem inadvertida ou deliberadamente material protegido por direitos autorais ou confidencial, que poderia então ser incorporado aos modelos de IA.
Os dados carregados pelos contratados destinam-se a treinar modelos de IA, permitindo que eles entendam e repliquem melhor os processos de trabalho humanos. Este processo envolve alimentar os modelos com vastas quantidades de dados, permitindo-lhes identificar padrões e relações dentro da informação. O objetivo é criar sistemas de IA capazes de realizar tarefas complexas com mínima intervenção humana.
O uso de exemplos do mundo real é considerado crucial para o desenvolvimento de modelos de IA que possam automatizar com precisão e eficácia os trabalhos de escritório. Ao treinar com amostras de trabalho autênticas, os sistemas de IA podem aprender a lidar com as nuances e complexidades de várias tarefas profissionais. No entanto, as implicações éticas e legais do uso de tais dados permanecem um tema de debate contínuo.
Atualmente, não está claro como a OpenAI planeja usar os dados carregados e quais salvaguardas estão em vigor para evitar o uso indevido ou a violação de direitos autorais. A empresa ainda não emitiu uma declaração oficial sobre o relatório. A situação destaca os desafios e complexidades envolvidos na obtenção e utilização de dados para treinamento de IA, particularmente ao lidar com informações sensíveis ou proprietárias. Os desenvolvimentos provavelmente serão monitorados de perto por especialistas jurídicos e observadores da indústria.
Discussion
Join the conversation
Be the first to comment