OpenAI hat GPT-5.3-Codex veröffentlicht, eine neue Version seines Codierungsmodells, während Anthropic Claude Opus 4.6, sein neuestes KI-Modell, vorstellte, was einen Wettbewerbsdruck in der KI-Landschaft signalisiert. Diese Entwicklungen kommen inmitten einer volatilen Phase für die KI-Industrie und die globalen Softwaremärkte, wobei Investoren laut VentureBeat Bedenken hinsichtlich der potenziellen Zerstörung etablierter Enterprise-Software-Unternehmen äußern.
GPT-5.3-Codex, verfügbar über Befehlszeile, IDE-Erweiterung, Weboberfläche und eine neue macOS-Desktop-App, übertrifft seine Vorgänger bei Benchmarks wie SWE-Bench Pro und Terminal-Bench 2.0, so Ars Technica. Während einige Schlagzeilen suggerierten, dass Codex sich selbst gebaut habe, stellte Ars Technica klar, dass dies eine Übertreibung sei, und betonte, dass das Modell für Aufgaben konzipiert ist, die denen von Enterprise-Softwareentwicklungsfirmen ähneln, wie z. B. die Verwaltung von Deployments und das Debugging.
Anthropic's Claude Opus 4.6, das am Donnerstag veröffentlicht wurde, verfügt über ein Kontextfenster von 1 Million Token und "Agent Teams", die für die Bearbeitung längerer, autonomer Workflows entwickelt wurden. Das Unternehmen behauptet, dass es OpenAI's GPT-5.2 bei wichtigen Enterprise-Benchmarks übertrifft, so VentureBeat. Diese Einführung stellt eine direkte Herausforderung für OpenAI's Codex dar, das ebenfalls kürzlich eine Desktop-Anwendung veröffentlicht hat.
In verwandten Nachrichten haben Forscher von Stanford, Nvidia und Together AI eine Technik namens Test-Time Training to Discover (TTT-Discover) entwickelt. Diese Technik optimiert GPU-Kernel und erreicht Geschwindigkeiten, die doppelt so hoch sind wie die von menschlichen Experten, so VentureBeat. TTT-Discover ermöglicht es Modellen, während des Inferenzprozesses weiter zu trainieren und Gewichte für das jeweilige Problem zu aktualisieren.
Die KI-Community beobachtet den Fortschritt dieser Modelle genau. Die Veröffentlichung neuer Frontier Large Language Models durch Unternehmen wie OpenAI und Anthropic weckt Erwartungen, wie die Model Evaluation & Threat Research (METR) Grafik hervorhebt, die ein exponentielles Wachstum bestimmter KI-Fähigkeiten nahelegt, so MIT Technology Review. Die Grafik spielt seit ihrer ersten Veröffentlichung im März letzten Jahres eine wichtige Rolle im KI-Diskurs.
Discussion
AI Experts & Community
Be the first to comment