OpenAI a lancé un nouveau modèle de codage, GPT-5.3-Codex-Spark, conçu pour des temps de réponse rapides, marquant son premier pas important au-delà de sa dépendance traditionnelle aux puces Nvidia, selon VentureBeat. Le modèle, fonctionnant sur le matériel de Cerebras Systems, vise une génération de code "quasi-instantanée". Pendant ce temps, les chercheurs de Nvidia ont développé une technique pour réduire les coûts de mémoire du raisonnement des grands modèles de langage jusqu'à huit fois, comme l'a rapporté VentureBeat.
Le nouveau modèle d'OpenAI représente un changement significatif pour l'entreprise, qui dépendait principalement de Nvidia pour son infrastructure. Cette décision intervient dans un contexte de relations tendues avec Nvidia, de critiques concernant les publicités de ChatGPT, d'un nouveau contrat avec le Pentagone et de changements organisationnels internes, selon VentureBeat. Le partenariat avec Cerebras Systems, un fabricant de puces spécialisé dans les charges de travail d'IA à faible latence, est considéré comme une manœuvre stratégique.
La nouvelle technique de Nvidia, appelée sparsification dynamique de la mémoire (DMS), compresse le cache clé-valeur (KV), la mémoire temporaire que les LLM génèrent. Des expériences montrent que DMS permet aux LLM de "réfléchir" plus longtemps et d'explorer plus de solutions sans perte de précision, selon VentureBeat.
Dans d'autres actualités technologiques, Waymo, le développeur de véhicules autonomes, recherche des changements réglementaires à Washington, DC, pour permettre à ses robotaxis de fonctionner sans chauffeurs humains, selon Wired. L'entreprise fait pression sur les responsables de la ville pour qu'ils adoptent de nouvelles réglementations depuis plus d'un an.
De plus, une vague de trafic de bots inexpliqué balaie le web, comme l'a rapporté Wired. Un analyste de données a constaté une augmentation soudaine du trafic en provenance de Chine et de Singapour vers son site web, qui publie des articles sur les activités paranormales.
Enfin, Wired a rendu compte de plusieurs autres développements, notamment les projets de l'ICE pour s'étendre aux États-Unis et la réponse du PDG de Palantir, Alex Karp, aux préoccupations des employés concernant le travail avec l'ICE. De plus, un rédacteur de Wired a expérimenté un assistant IA, OpenClaw, pour voir comment il pouvait gérer les tâches quotidiennes.
Discussion
AI Experts & Community
Be the first to comment