Según un informe de Wired, OpenAI y la empresa de datos de entrenamiento Handshake AI están solicitando a contratistas externos que suban trabajos reales completados en roles pasados y actuales. La iniciativa parece ser parte de una estrategia más amplia entre las empresas de IA para aprovechar a los contratistas en la generación de datos de entrenamiento de alta calidad, con el objetivo final de automatizar más tareas administrativas.
Según el informe de Wired, la presentación interna de OpenAI supuestamente instruye a los contratistas a detallar las tareas realizadas en trabajos anteriores y a proporcionar ejemplos tangibles de trabajo, como documentos de Word, archivos PDF, presentaciones de PowerPoint, hojas de Excel, imágenes o repositorios de código. Según los informes, la empresa aconseja a los contratistas que eliminen la información confidencial y los datos de identificación personal antes de subirlos, ofreciendo una "herramienta de limpieza ChatGPT Superstar" para este fin.
Este enfoque plantea importantes preocupaciones sobre la propiedad intelectual. Evan Brown, un abogado de propiedad intelectual, dijo a Wired que cualquier laboratorio de IA que adopte este método se enfrenta a un riesgo considerable, ya que depende en gran medida de la fiabilidad de sus contratistas. La preocupación se deriva de la posibilidad de que los contratistas suban inadvertida o deliberadamente material protegido por derechos de autor o material confidencial, que podría incorporarse a los modelos de IA.
Los datos subidos por los contratistas están destinados a entrenar modelos de IA, permitiéndoles comprender y replicar mejor los procesos de trabajo humanos. Este proceso implica alimentar los modelos con grandes cantidades de datos, permitiéndoles identificar patrones y relaciones dentro de la información. El objetivo es crear sistemas de IA capaces de realizar tareas complejas con una mínima intervención humana.
El uso de ejemplos del mundo real se considera crucial para desarrollar modelos de IA que puedan automatizar de forma precisa y eficaz los trabajos administrativos. Al entrenar con muestras de trabajo auténticas, los sistemas de IA pueden aprender a manejar los matices y las complejidades de diversas tareas profesionales. Sin embargo, las implicaciones éticas y legales del uso de dichos datos siguen siendo objeto de debate.
Actualmente, no está claro cómo planea OpenAI utilizar los datos subidos y qué salvaguardias existen para evitar el uso indebido o la infracción de los derechos de autor. La empresa aún no ha emitido una declaración oficial sobre el informe. La situación pone de manifiesto los retos y las complejidades que implica la obtención y utilización de datos para el entrenamiento de la IA, especialmente cuando se trata de información sensible o confidencial. Es probable que los expertos legales y los observadores de la industria sigan de cerca los acontecimientos.
Discussion
Join the conversation
Be the first to comment