OpenAI a lancé GPT-5.3-Codex, une nouvelle version de son modèle de codage, tandis qu'Anthropic a dévoilé Claude Opus 4.6, son dernier modèle d'IA, signalant une poussée concurrentielle dans le paysage de l'IA. Ces développements surviennent dans une période volatile pour l'industrie de l'IA et les marchés mondiaux des logiciels, les investisseurs exprimant des inquiétudes quant à la perturbation potentielle des entreprises de logiciels d'entreprise établies, selon VentureBeat.
GPT-5.3-Codex, disponible via la ligne de commande, l'extension IDE, l'interface web et une nouvelle application de bureau macOS, surpasse ses prédécesseurs sur des benchmarks tels que SWE-Bench Pro et Terminal-Bench 2.0, selon Ars Technica. Bien que certains titres aient suggéré que Codex s'était construit lui-même, Ars Technica a précisé qu'il s'agissait d'une exagération, soulignant que le modèle est conçu pour des tâches similaires à celles utilisées par les entreprises de développement de logiciels d'entreprise, telles que la gestion des déploiements et le débogage.
Claude Opus 4.6 d'Anthropic, lancé jeudi, dispose d'une fenêtre de contexte de 1 million de tokens et d'"équipes d'agents" conçues pour gérer des flux de travail autonomes plus longs. L'entreprise affirme qu'il surpasse GPT-5.2 d'OpenAI sur des benchmarks d'entreprise clés, selon VentureBeat. Ce lancement défie directement Codex d'OpenAI, qui a également récemment lancé une application de bureau.
Dans d'autres nouvelles, des chercheurs de Stanford, Nvidia et Together AI ont développé une technique appelée Test-Time Training to Discover (TTT-Discover). Cette technique optimise les kernels GPU, atteignant des vitesses deux fois plus rapides que celles obtenues par des experts humains, selon VentureBeat. TTT-Discover permet aux modèles de continuer à s'entraîner pendant le processus d'inférence, en mettant à jour les poids pour le problème spécifique en question.
La communauté de l'IA surveille de près les progrès de ces modèles. La publication de nouveaux grands modèles de langage de pointe par des entreprises comme OpenAI et Anthropic suscite l'anticipation, comme le souligne le graphique Model Evaluation & Threat Research (METR), qui suggère une croissance exponentielle de certaines capacités de l'IA, selon MIT Technology Review. Le graphique a joué un rôle majeur dans le discours sur l'IA depuis sa publication initiale en mars de l'année dernière.
Discussion
AI Experts & Community
Be the first to comment