Laut einem vertraulichen Dokument von OpenAI hat das Unternehmen "Leute aus verschiedenen Berufen eingestellt, um reale Aufgaben zu sammeln, die Ihren Vollzeitjobs nachempfunden sind, damit wir messen können, wie gut KI-Modelle diese Aufgaben erfüllen". Das Dokument weist Auftragnehmer an, "vorhandene, langfristige oder komplexe Arbeiten (Stunden oder Tage), die Sie in Ihrem Beruf ausgeführt haben, zu nehmen und jede in eine Aufgabe zu verwandeln".
Diese Initiative ist Teil von OpenAIs umfassenderen Bemühungen, seine Fortschritte bei der Erreichung der allgemeinen künstlichen Intelligenz (AGI) zu bewerten. Im September startete OpenAI einen neuen Evaluierungsprozess, der sich auf den Vergleich der Leistung seiner KI-Modelle mit menschlichen Fachkräften aus verschiedenen Branchen konzentriert. OpenAI definiert AGI als ein KI-System, das menschliche Fähigkeiten in den meisten wirtschaftlich wertvollen Aufgaben übertrifft.
Die aus diesen realen Aufgaben gesammelten Daten werden verwendet, um die KI-Modelle von OpenAI zu trainieren und zu verfeinern, damit sie komplexe Aufgaben besser verstehen und ausführen können. Durch den Vergleich der KI-Leistung mit einer menschlichen Basislinie hofft OpenAI, Bereiche zu identifizieren, in denen seine Modelle hervorragende Leistungen erbringen, und Bereiche, die weiterer Verbesserungen bedürfen. Dieser Ansatz ist entscheidend für die Entwicklung von KI-Systemen, die verschiedene berufliche Aufgaben effektiv ergänzen oder sogar automatisieren können.
Die Auswirkungen der Erreichung von AGI sind weitreichend und könnten Branchen verändern und die Art der Arbeit neu gestalten. Während die Entwicklung von AGI erhebliche Vorteile verspricht, wie z. B. eine gesteigerte Produktivität und Innovation, wirft sie auch Bedenken hinsichtlich des Arbeitsplatzabbaus und der ethischen Erwägungen von zunehmend autonomen KI-Systemen auf. OpenAIs Bemühungen, die KI-Leistung anhand menschlicher Fähigkeiten zu messen, sind ein Schritt zum Verständnis und zur Bewältigung dieser komplexen Probleme.
Der aktuelle Stand des Projekts umfasst die laufende Datenerfassung und -analyse. OpenAI hat noch keine spezifischen Details über die Leistung seiner Modelle im Vergleich zur menschlichen Basislinie veröffentlicht. Es wird jedoch erwartet, dass das Unternehmen seinen Evaluierungsprozess weiter verfeinern und neue Daten einbeziehen wird, während es seinem Ziel der Erreichung von AGI näher kommt. Die nächsten Entwicklungen werden wahrscheinlich weitere Iterationen von KI-Modellen auf der Grundlage der gesammelten Daten und fortlaufende Bewertungen ihrer Leistung über ein breiteres Aufgabenspektrum hinweg umfassen.
Discussion
Join the conversation
Be the first to comment