Laut einem Bericht von Wired fordern OpenAI und das Trainingsdatenunternehmen Handshake AI angeblich ihre externen Auftragnehmer auf, tatsächlich erledigte Arbeit aus vergangenen und aktuellen Aufträgen hochzuladen. Die Anfrage scheint Teil einer umfassenderen Strategie von KI-Unternehmen zu sein, qualitativ hochwertige Trainingsdaten zu erhalten, mit dem Ziel, ihre Modelle in die Lage zu versetzen, mehr Büroarbeiten zu automatisieren.
Dem Bericht zufolge weisen die Präsentationsmaterialien von OpenAI die Auftragnehmer an, die in früheren Jobs ausgeführten Aufgaben detailliert zu beschreiben und Beispiele für tatsächliche Arbeitsergebnisse hochzuladen, wie z. B. Word-Dokumente, PDFs, PowerPoint-Präsentationen, Excel-Dateien, Bilder und Code-Repositories. Das Unternehmen rät den Auftragnehmern angeblich, proprietäre und personenbezogene Daten vor dem Hochladen dieser Dateien zu entfernen, und verweist sie zu diesem Zweck auf ein "ChatGPT Superstar Scrubbing Tool".
Die Praxis wirft Bedenken hinsichtlich der Rechte an geistigem Eigentum auf. Evan Brown, ein Anwalt für geistiges Eigentum, sagte gegenüber Wired, dass dieser Ansatz erhebliche Risiken für KI-Labore birgt, da er stark auf die Vertrauenswürdigkeit der Auftragnehmer angewiesen ist, sensible Daten ordnungsgemäß zu bereinigen.
Das Drängen auf reale Daten spiegelt die wachsende Nachfrage nach qualitativ hochwertigen Trainingsdatensätzen wider, um die Leistung und Fähigkeiten von KI-Modellen zu verbessern. Diese Modelle, insbesondere große Sprachmodelle (LLMs) wie die GPT-Serie von OpenAI, benötigen riesige Datenmengen, um effektiv zu lernen und zu generalisieren. Durch das Training mit authentischen Arbeitsbeispielen hoffen KI-Entwickler, Modelle zu erstellen, die komplexe Aufgaben genauer replizieren und automatisieren können.
Die Strategie wirft jedoch auch ethische und rechtliche Fragen auf. Die Verwendung von urheberrechtlich geschützten oder vertraulichen Informationen, selbst wenn sie anonymisiert sind, könnte zu potenziellen Klagen und Schäden am Ruf eines Unternehmens führen. Es gibt auch Bedenken hinsichtlich des Potenzials für Verzerrungen in den Daten, die diskriminierende Ergebnisse perpetuieren könnten, wenn sie nicht sorgfältig behandelt werden.
Die langfristigen Auswirkungen dieser Datenerfassungsstrategie sind erheblich. Wenn KI-Modelle erfolgreich eine breitere Palette von Büroarbeiten automatisieren können, könnte dies zu erheblichen Veränderungen auf dem Arbeitsmarkt führen und möglicherweise Arbeitnehmer in verschiedenen Branchen verdrängen. Das Ausmaß dieser Auswirkungen ist noch ungewiss, aber Experten beobachten die Entwicklungen im Bereich der KI und ihre potenziellen Folgen für die Gesellschaft genau.
OpenAI hat noch keine offizielle Stellungnahme zu dem Bericht veröffentlicht. Die Maßnahmen des Unternehmens werden wahrscheinlich von Aufsichtsbehörden und Branchenbeobachtern genau unter die Lupe genommen, da sich die Debatte über KI-Ethik und Datenschutz ständig weiterentwickelt.
Discussion
Join the conversation
Be the first to comment