OpenAI fordert externe Auftragnehmer auf, reale Aufgaben und Tätigkeiten aus ihrer aktuellen oder früheren Beschäftigung hochzuladen, um die Leistung seiner KI-Modelle der nächsten Generation zu bewerten. Dokumente, die WIRED von OpenAI und dem Trainingsdatenunternehmen Handshake AI erhalten hat, zeigen, dass das Projekt darauf abzielt, eine menschliche Leistungsbasis für verschiedene Aufgaben zu schaffen, die dann zur Bewertung der Fähigkeiten von KI-Modellen verwendet werden soll.
Diese Initiative ist Teil von OpenAIs umfassenderen Bemühungen, die im September gestartet wurden, um seine KI-Modelle mit menschlichen Fachkräften aus verschiedenen Branchen zu vergleichen. Das Unternehmen betrachtet diesen Vergleich als eine entscheidende Metrik, um den Fortschritt bei der Erreichung der künstlichen allgemeinen Intelligenz (AGI) zu messen, die als ein KI-System definiert ist, das die menschlichen Fähigkeiten bei den meisten wirtschaftlich wertvollen Aufgaben übertrifft.
Laut einem vertraulichen OpenAI-Dokument haben wir "Leute aus verschiedenen Berufen eingestellt, um bei der Sammlung von realen Aufgaben zu helfen, die nach dem Vorbild Ihrer Vollzeitjobs erstellt wurden, damit wir messen können, wie gut KI-Modelle diese Aufgaben erfüllen." Das Dokument weist Auftragnehmer an: "Nehmen Sie bestehende, langfristige oder komplexe Arbeiten (Stunden oder Tage), die Sie in Ihrem Beruf ausgeführt haben, und wandeln Sie jede davon in eine Aufgabe um."
Die Datenerfassungsstrategie verdeutlicht eine zentrale Herausforderung bei der KI-Entwicklung: die Fähigkeit einer KI, reale Aufgaben zu erfüllen, genau zu bewerten. Durch den Vergleich der KI-Leistung mit einer menschlichen Basislinie, die aus tatsächlicher Arbeit abgeleitet wurde, will OpenAI ein differenzierteres Verständnis der Stärken und Schwächen seiner Modelle gewinnen. Dieser Ansatz ist besonders relevant, da KI-Systeme zunehmend in professionelle Umgebungen integriert werden.
Die Auswirkungen der Erreichung von AGI sind weitreichend und könnten Branchen verändern und die Natur der Arbeit umgestalten. Während OpenAI die potenziellen Vorteile von AGI, wie z. B. gesteigerte Produktivität und Innovation, hervorhebt, wirft die Entwicklung auch Bedenken hinsichtlich des Arbeitsplatzabbaus und der ethischen Erwägungen von zunehmend autonomen KI-Systemen auf.
Der Bewertungsprozess von OpenAI spiegelt die laufende Debatte innerhalb der KI-Community darüber wider, wie man zunehmend leistungsfähige KI-Systeme am besten messen und kontrollieren kann. Da KI-Modelle immer ausgefeilter werden, ist die Festlegung zuverlässiger Benchmarks und Sicherheitsprotokolle unerlässlich, um ihre verantwortungsvolle Entwicklung und Bereitstellung zu gewährleisten. Das Unternehmen hat keine spezifischen Details über die Arten der gesammelten Aufgaben oder die Kriterien zur Bewertung der KI-Leistung veröffentlicht, hat aber erklärt, dass die Daten verwendet werden, um die Genauigkeit und Zuverlässigkeit seiner zukünftigen KI-Modelle zu verbessern. Das Projekt ist noch nicht abgeschlossen, und die Ergebnisse der Bewertung werden voraussichtlich die zukünftigen Entwicklungsbemühungen bei OpenAI beeinflussen.
Discussion
Join the conversation
Be the first to comment