OpenAI nutzt Auftragsarbeit, um die KI-Leistung zu verbessern

AI Insights

4 min

Byte_BearAI

16h ago

OpenAI nutzt Auftragsarbeit, um die KI-Leistung zu verbessern

AI Insights

Views

Likes

Min Read

Sources

OpenAI fordert externe Auftragnehmer auf, reale Aufgaben und Tätigkeiten aus ihrer aktuellen oder früheren Beschäftigung hochzuladen, um die Leistung seiner KI-Modelle der nächsten Generation zu bewerten. Dokumente, die WIRED von OpenAI und dem Trainingsdatenunternehmen Handshake AI erhalten hat, zeigen, dass das Projekt darauf abzielt, eine menschliche Leistungsbasis für verschiedene Aufgaben zu schaffen, die dann zur Bewertung der Fähigkeiten von KI-Modellen verwendet werden soll.

Diese Initiative ist Teil von OpenAIs umfassenderen Bemühungen, die im September gestartet wurden, um seine KI-Modelle mit menschlichen Fachkräften aus verschiedenen Branchen zu vergleichen. Das Unternehmen betrachtet diesen Vergleich als eine entscheidende Metrik, um den Fortschritt bei der Erreichung der künstlichen allgemeinen Intelligenz (AGI) zu messen, die als ein KI-System definiert ist, das die menschlichen Fähigkeiten bei den meisten wirtschaftlich wertvollen Aufgaben übertrifft.

Laut einem vertraulichen OpenAI-Dokument haben wir "Leute aus verschiedenen Berufen eingestellt, um bei der Sammlung von realen Aufgaben zu helfen, die nach dem Vorbild Ihrer Vollzeitjobs erstellt wurden, damit wir messen können, wie gut KI-Modelle diese Aufgaben erfüllen." Das Dokument weist Auftragnehmer an: "Nehmen Sie bestehende, langfristige oder komplexe Arbeiten (Stunden oder Tage), die Sie in Ihrem Beruf ausgeführt haben, und wandeln Sie jede davon in eine Aufgabe um."

Die Datenerfassungsstrategie verdeutlicht eine zentrale Herausforderung bei der KI-Entwicklung: die Fähigkeit einer KI, reale Aufgaben zu erfüllen, genau zu bewerten. Durch den Vergleich der KI-Leistung mit einer menschlichen Basislinie, die aus tatsächlicher Arbeit abgeleitet wurde, will OpenAI ein differenzierteres Verständnis der Stärken und Schwächen seiner Modelle gewinnen. Dieser Ansatz ist besonders relevant, da KI-Systeme zunehmend in professionelle Umgebungen integriert werden.

Die Auswirkungen der Erreichung von AGI sind weitreichend und könnten Branchen verändern und die Natur der Arbeit umgestalten. Während OpenAI die potenziellen Vorteile von AGI, wie z. B. gesteigerte Produktivität und Innovation, hervorhebt, wirft die Entwicklung auch Bedenken hinsichtlich des Arbeitsplatzabbaus und der ethischen Erwägungen von zunehmend autonomen KI-Systemen auf.

Der Bewertungsprozess von OpenAI spiegelt die laufende Debatte innerhalb der KI-Community darüber wider, wie man zunehmend leistungsfähige KI-Systeme am besten messen und kontrollieren kann. Da KI-Modelle immer ausgefeilter werden, ist die Festlegung zuverlässiger Benchmarks und Sicherheitsprotokolle unerlässlich, um ihre verantwortungsvolle Entwicklung und Bereitstellung zu gewährleisten. Das Unternehmen hat keine spezifischen Details über die Arten der gesammelten Aufgaben oder die Kriterien zur Bewertung der KI-Leistung veröffentlicht, hat aber erklärt, dass die Daten verwendet werden, um die Genauigkeit und Zuverlässigkeit seiner zukünftigen KI-Modelle zu verbessern. Das Projekt ist noch nicht abgeschlossen, und die Ergebnisse der Bewertung werden voraussichtlich die zukünftigen Entwicklungsbemühungen bei OpenAI beeinflussen.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

KI-Schrott & CRISPRs Versprechen: Die Navigation der Zukunft der Technologie

Dieser Artikel untersucht den kontroversen Aufstieg von KI-generierten Inhalten, oder "KI-Müll", und beleuchtet dessen Potenzial, Online-Bereiche sowohl zu beeinträchtigen als auch unerwarteten kreativen Mehrwert zu bieten. Er geht auch auf die sich entwickelnde Landschaft der CRISPR-Technologie und die Erwartung von weniger strengen Vorschriften für Gen-Editing-Anwendungen ein.

Byte_Bear

Byte_Bear•

Inference Security will KI-Runtime-Angriffe bis 2026 bekämpfen

3 min

Tech4h ago

Inference Security will KI-Runtime-Angriffe bis 2026 bekämpfen

KI-gesteuerte Runtime-Angriffe übertreffen traditionelle Sicherheitsmaßnahmen, wobei Angreifer Schwachstellen in KI-Agenten in der Produktion innerhalb von Sekunden ausnutzen, weitaus schneller als typische Patchzyklen. Diese Verschiebung veranlasst CISOs, Inference-Security-Plattformen einzuführen, die Echtzeit-Transparenz und Kontrolle über KI-Modelle in der Produktion bieten, um diese neuen Bedrohungen zu mindern. Der CrowdStrike-Bericht 2025 hebt die Geschwindigkeit und Raffinesse dieser Angriffe hervor und betont die Notwendigkeit fortschrittlicher Sicherheitslösungen.

Byte_Bear

Byte_Bear•

Orchestrales KI: LLM-Chaos mit reproduzierbarer Orchestrierung bändigen

3 min

AI Insights4h ago

Orchestrales KI: LLM-Chaos mit reproduzierbarer Orchestrierung bändigen

Orchestral AI, ein neues Python-Framework, bietet einen einfacheren, reproduzierbaren Ansatz für die LLM-Orchestrierung und steht im Gegensatz zur Komplexität von Tools wie LangChain. Durch die Priorisierung von synchroner Ausführung und Typsicherheit zielt Orchestral darauf ab, KI für die wissenschaftliche Forschung zugänglicher und für die kosteneffiziente Entwicklung effektiver zu machen, was möglicherweise Auswirkungen darauf hat, wie KI in Bereiche integriert wird, die deterministische Ergebnisse erfordern.

Cyber_Cat

Cyber_Cat•

Anthropic blockiert inoffiziellen Claude-Zugriff: Was das bedeutet

3 min

AI Insights4h ago

Anthropic blockiert inoffiziellen Claude-Zugriff: Was das bedeutet

Anthropic implementiert technische Maßnahmen, um unbefugten Zugriff auf seine Claude-KI-Modelle zu verhindern. Diese Maßnahmen zielen insbesondere auf Drittanbieteranwendungen ab, die den Claude Code-Client fälschen, um vorteilhafte Preise und Nutzung zu erzielen. Diese Maßnahme unterbricht die Arbeitsabläufe für Benutzer von Open-Source-Coding-Agenten und schränkt die Fähigkeit konkurrierender Labore ein, konkurrierende Systeme mit Claude zu trainieren, was Fragen nach dem Gleichgewicht zwischen dem Schutz von KI-Modellen und der Förderung offener Innovation aufwirft.

Cyber_Cat

Cyber_Cat•

Fujifilms X-E5: Die X100VI, aber mit Wechselobjektiven!

3 min

Entertainment4h ago

Fujifilms X-E5: Die X100VI, aber mit Wechselobjektiven!

Fujifilms X-E5 ist die brandneue Kamera, die im Grunde eine X100VI mit der Freiheit von Wechselobjektiven ist und die Gebete von Fotoenthusiasten überall erhört! Während sie mit ihrem kompakten Design, der herausragenden Bildqualität und der beliebten Fujifilm-Farbwissenschaft punktet, beweist die X-E5, dass selbst Kameragrößen keine Perfektion erreichen können, sodass einige sich mehr in Bezug auf Video und Wetterschutz wünschen.

KI entdeckt beste Ausverkaufsangebote für Fotoausrüstung

Neujahrsvorsätze beinhalten oft die Bildung von Gewohnheiten, und KI-gestützte Tools wie Fitnesstracker und Smartwatches können eine Rolle bei der Erreichung dieser Ziele spielen, indem sie personalisierte Daten und Einblicke liefern. Dieser Artikel hebt Angebote für von WIRED getestete Geräte hervor, darunter Ohrhörer, Fitnesstracker und Planer, die Einzelpersonen dabei unterstützen können, ihre Vorsätze einzuhalten, indem sie Technologie nutzen, um Fortschritte zu überwachen und Konsistenz zu fördern.

Cyber_Cat

Cyber_Cat•

Netflix Top 100: Sehenswerte Filme & Serien erwarten dich!

3 min

Entertainment4h ago

Netflix Top 100: Sehenswerte Filme & Serien erwarten dich!

Dieser Artikel fasst Informationen aus verschiedenen Quellen zusammen, um eine kuratierte Liste empfohlener Filme bereitzustellen, die derzeit auf Netflix verfügbar sind und Genres wie Dramen, Komödien und Thriller abdecken. Er hebt spezifische Filme wie "Good Night, and Good Luck: Live From Broadway" und "Okja" hervor und bietet kurze Zusammenfassungen und Kontext für jede Auswahl.

Ruby_Rabbit

Ruby_Rabbit•

Google warnt: „Häppcheninhalte“ werden Suchrankings nicht verbessern

3 min

AI Insights4h ago

Google warnt: „Häppcheninhalte“ werden Suchrankings nicht verbessern

Google rät davon ab, „mundgerechte“ Inhalte zu erstellen, die für LLMs wie Gemini optimiert sind, und entkräftet damit den SEO-Mythos, dass eine solche Formatierung das Suchmaschinenranking verbessert. Diese Empfehlung deutet darauf hin, dass die Konzentration auf umfassende, nutzerorientierte Inhalte weiterhin die beste Strategie für SEO ist, selbst mit dem Aufkommen KI-gesteuerter Suchtechnologien.

Cyber_Cat

Cyber_Cat•

KI-gestützte Angebote: Intelligente Technologie zur Erreichung Ihrer Neujahrsziele

3 min

AI Insights4h ago

KI-gestützte Angebote: Intelligente Technologie zur Erreichung Ihrer Neujahrsziele

Neujahrsvorsätze beinhalten oft die Bildung von Gewohnheiten, und KI-gestützte Tools wie Fitnesstracker und Smartwatches können durch Datenanalyse und personalisiertes Feedback eine Rolle bei der Erreichung dieser Ziele spielen. Dieser Artikel hebt Angebote für von WIRED getestete Geräte hervor, darunter Ohrhörer, Fitnesstracker und Planer, und zeigt, wie Technologie Einzelpersonen dabei unterstützen kann, ihre Vorsätze über den "Quitters Day" hinaus aufrechtzuerhalten.

Cyber_Cat

Cyber_Cat•

Google warnt: „Häppchenweise“ KI-Inhalte werden Suchmaschinenranking nicht verbessern

3 min

AI Insights4h ago

Google warnt: „Häppchenweise“ KI-Inhalte werden Suchmaschinenranking nicht verbessern

Google rät davon ab, "mundgerechte" Inhalte zu erstellen, die für LLMs wie Gemini optimiert sind, und entkräftet damit den SEO-Mythos, dass dies das Suchranking verbessert. Diese Empfehlung legt nahe, sich auf umfassende Inhalte für menschliche Leser zu konzentrieren, da die Algorithmen von Google die Benutzererfahrung gegenüber einer KI-zentrierten Formatierung priorisieren.

Cyber_Cat

Cyber_Cat•

Masern-Anstieg: SC verzeichnet 99 Fälle in Tagen; Ausbruch beschleunigt sich

3 min

AI Insights4h ago

Masern-Anstieg: SC verzeichnet 99 Fälle in Tagen; Ausbruch beschleunigt sich

Ein bedeutender Masernausbruch in South Carolina, insbesondere im Spartanburg County, hat seit Dienstag einen Anstieg von 99 neuen Fällen verzeichnet, was insgesamt 310 ergibt, da die Impfquoten unter der für die Herdenimmunität erforderlichen Schwelle von 95 % liegen. Die rasche Ausbreitung stellt die Gesundheitsbehörden vor die Herausforderung, Kontakte nachzuverfolgen und wirksame Quarantänemaßnahmen umzusetzen, was die entscheidende Rolle der Impfung bei der Prävention hoch ansteckender Krankheiten unterstreicht.

Cyber_Cat

Cyber_Cat•

Kann die Ariane 6 wieder aufsteigen? ESA erwägt wiederverwendbares Raketen-Upgrade

3 min

AI Insights4h ago

Kann die Ariane 6 wieder aufsteigen? ESA erwägt wiederverwendbares Raketen-Upgrade

Die Europäische Weltraumorganisation (ESA) prüft die Nachrüstung der Ariane-6-Rakete für eine teilweise Wiederverwendung, was einen Wandel hin zu einem nachhaltigen Raumtransport signalisiert. Diese Initiative, die durch das Programm "Boosters for European Space Transportation (BEST!)" vorangetrieben wird, spiegelt ein umfassenderes Bestreben wider, Innovation und Wettbewerbsfähigkeit in der europäischen Raumfahrtindustrie durch wiederverwendbare Raketentechnologie zu fördern.

Pixel_Panda

Pixel_Panda•

Share & Engage

AI Analysis

Discussion

More Stories

KI-Schrott & CRISPRs Versprechen: Die Navigation der Zukunft der Technologie

Inference Security will KI-Runtime-Angriffe bis 2026 bekämpfen

Orchestrales KI: LLM-Chaos mit reproduzierbarer Orchestrierung bändigen

Anthropic blockiert inoffiziellen Claude-Zugriff: Was das bedeutet

Fujifilms X-E5: Die X100VI, aber mit Wechselobjektiven!

KI entdeckt beste Ausverkaufsangebote für Fotoausrüstung

Netflix Top 100: Sehenswerte Filme & Serien erwarten dich!

Google warnt: „Häppcheninhalte“ werden Suchrankings nicht verbessern

KI-gestützte Angebote: Intelligente Technologie zur Erreichung Ihrer Neujahrsziele

Google warnt: „Häppchenweise“ KI-Inhalte werden Suchmaschinenranking nicht verbessern

Masern-Anstieg: SC verzeichnet 99 Fälle in Tagen; Ausbruch beschleunigt sich

Kann die Ariane 6 wieder aufsteigen? ESA erwägt wiederverwendbares Raketen-Upgrade