Laut einem Bericht von Wired fordern OpenAI und das Trainingsdatenunternehmen Handshake AI angeblich von Drittanbietern, dass sie reale Arbeitsergebnisse aus früheren und aktuellen Positionen hochladen. Die Initiative scheint Teil einer umfassenderen Strategie von KI-Unternehmen zu sein, Auftragnehmer zur Erstellung hochwertiger Trainingsdaten zu nutzen, mit dem letztendlichen Ziel, mehr Büroarbeiten zu automatisieren.
Dem Wired-Bericht zufolge weist eine interne Präsentation von OpenAI Auftragnehmer angeblich an, Aufgaben, die in früheren Jobs ausgeführt wurden, detailliert zu beschreiben und konkrete Arbeitsbeispiele wie Word-Dokumente, PDFs, PowerPoint-Präsentationen, Excel-Tabellen, Bilder oder Code-Repositories bereitzustellen. Das Unternehmen rät Auftragnehmern angeblich, vor dem Hochladen firmeneigene Informationen und personenbezogene Daten zu entfernen und bietet zu diesem Zweck ein "ChatGPT Superstar Scrubbing Tool" an.
Dieser Ansatz wirft erhebliche Bedenken hinsichtlich des geistigen Eigentums auf. Evan Brown, ein Anwalt für geistiges Eigentum, sagte gegenüber Wired, dass jedes KI-Labor, das diese Methode anwendet, einem erheblichen Risiko ausgesetzt sei, da es stark auf die Vertrauenswürdigkeit seiner Auftragnehmer angewiesen sei. Die Besorgnis rührt von dem Potenzial her, dass Auftragnehmer unbeabsichtigt oder absichtlich urheberrechtlich geschütztes oder vertrauliches Material hochladen könnten, das dann in KI-Modelle integriert werden könnte.
Die von Auftragnehmern hochgeladenen Daten sollen KI-Modelle trainieren, damit diese menschliche Arbeitsprozesse besser verstehen und nachbilden können. Dieser Prozess beinhaltet das Einspeisen großer Datenmengen in die Modelle, wodurch diese Muster und Beziehungen innerhalb der Informationen erkennen können. Ziel ist es, KI-Systeme zu schaffen, die komplexe Aufgaben mit minimalem menschlichen Eingriff ausführen können.
Die Verwendung von realen Beispielen gilt als entscheidend für die Entwicklung von KI-Modellen, die Büroarbeitsplätze präzise und effektiv automatisieren können. Durch das Training mit authentischen Arbeitsbeispielen können KI-Systeme lernen, die Nuancen und Komplexitäten verschiedener beruflicher Aufgaben zu bewältigen. Die ethischen und rechtlichen Implikationen der Verwendung solcher Daten sind jedoch weiterhin Gegenstand laufender Debatten.
Derzeit ist unklar, wie OpenAI die hochgeladenen Daten zu nutzen plant und welche Schutzmaßnahmen vorhanden sind, um Missbrauch oder Urheberrechtsverletzungen zu verhindern. Das Unternehmen hat sich noch nicht offiziell zu dem Bericht geäußert. Die Situation verdeutlicht die Herausforderungen und Komplexitäten, die mit der Beschaffung und Nutzung von Daten für das KI-Training verbunden sind, insbesondere beim Umgang mit sensiblen oder proprietären Informationen. Die Entwicklungen werden wahrscheinlich von Rechtsexperten und Branchenbeobachtern gleichermaßen genau beobachtet werden.
Discussion
Join the conversation
Be the first to comment