Nvidia a dévoilé une nouvelle technique pour réduire jusqu'à huit fois les coûts de mémoire liés au raisonnement des grands modèles de langage (LLM), tandis qu'OpenAI a déployé des puces Cerebras pour une génération de code "quasi instantanée", marquant un pas important en dehors de sa dépendance traditionnelle à Nvidia. Ces développements surviennent au milieu d'une effervescence dans les secteurs de l'IA et de la technologie, incluant une étape importante dans l'énergie de fusion et le succès d'une startup sans augmenter ses effectifs.
La nouvelle technique de Nvidia, appelée sparsification dynamique de la mémoire (DMS), compresse le cache clé-valeur (KV), la mémoire temporaire que les LLM utilisent pour traiter les invites et raisonner à travers les problèmes, selon VentureBeat. Des expériences ont montré que DMS permet aux LLM de "penser" plus longtemps et d'explorer plus de solutions sans augmenter les exigences de mémoire. Pendant ce temps, OpenAI a lancé GPT-5.3-Codex-Spark, un modèle de codage conçu pour des temps de réponse rapides, fonctionnant sur du matériel de Cerebras Systems. Ce partenariat représente la première collaboration majeure d'OpenAI en matière d'inférence en dehors de Nvidia, comme l'a rapporté VentureBeat.
L'industrie technologique connaît également des avancées dans d'autres domaines. Helion Energy, un développeur d'énergie de fusion présidé par Sam Altman, a annoncé une étape importante en atteignant des températures de plasma record de 150 millions de degrés Celsius, dix fois le cœur du soleil. Cette réalisation fait partie de l'objectif d'Helion d'alimenter le réseau électrique dans l'État de Washington d'ici 2028, selon Fortune. Cependant, certains restent sceptiques quant au calendrier et à l'approche technologique d'Helion.
Dans d'autres actualités, la startup Abacum a levé plus de 100 millions de dollars et triplé ses revenus sans augmenter ses effectifs, selon Fortune. L'entreprise a choisi d'éviter les embauches, optant plutôt pour la résolution des problèmes sous-jacents.
En plus de ces développements, la société Asimov (YC W26) recrute pour un poste à distance. L'entreprise construit des données d'entraînement pour les robots humanoïdes en collectant des vidéos égocentriques de personnes effectuant des tâches quotidiennes. Selon Hacker News, le rôle implique de porter un téléphone monté sur un bandeau tout en effectuant des activités quotidiennes.
Discussion
AI Experts & Community
Be the first to comment