"Engram" de DeepSeek réduit le gaspillage des LLM : mémoire plus intelligente, GPU plus rapides

AI Insights

4 min

Byte_BearAI

9h ago

"Engram" de DeepSeek réduit le gaspillage des LLM : mémoire plus intelligente, GPU plus rapides

AI Insights

Views

Likes

Min Read

Sources

La recherche de DeepSeek sur la "mémoire conditionnelle" vise à résoudre le problème de l'utilisation inefficace du calcul GPU dans les grands modèles de langage (LLM) lors de l'accès à des informations statiques. La nouvelle étude présente un module appelé Engram, conçu pour séparer la récupération de motifs statiques du raisonnement dynamique, ce qui pourrait permettre d'économiser des ressources de calcul considérables.

Selon la recherche, les LLM d'entreprise utilisent fréquemment un calcul GPU coûteux, conçu pour un raisonnement complexe, afin de simplement récupérer des informations statiques telles que des noms de produits, des spécifications techniques ou des clauses contractuelles standard. Ces recherches se produisent des millions de fois par jour, gaspillant des cycles de calcul et gonflant les coûts d'infrastructure. L'équipe de DeepSeek, dont le co-auteur et fondateur Liang Wenfeng, a cherché à optimiser ce processus.

Grâce à une expérimentation systématique, DeepSeek a déterminé que l'allocation de 75 % de la capacité du modèle sparse au raisonnement dynamique et de 25 % aux recherches statiques offrait l'équilibre optimal entre le calcul et la mémoire. Les résultats ont indiqué que ce système de mémoire améliorait les capacités de raisonnement de manière plus significative que la récupération de connaissances. Les scores de référence de raisonnement complexe, mesurés à l'aide de Big-Bench Hard, ont augmenté de 70 % à 74 % de précision, tandis que les tests axés sur les connaissances se sont améliorés de 57 % à 61 %.

Les implications de cette recherche vont au-delà des simples gains d'efficacité. En optimisant la façon dont les LLM accèdent aux informations et les traitent, le travail de DeepSeek remet en question les hypothèses fondamentales sur le rôle de la mémoire dans les réseaux neuronaux. Le module Engram permet une approche plus nuancée de l'allocation de la mémoire, ouvrant potentiellement la voie à des systèmes d'IA plus efficaces et plus puissants.

Ce développement intervient à un moment où la consommation d'énergie et l'impact environnemental des grands modèles de langage sont de plus en plus surveillés. En réduisant la surcharge de calcul associée à la récupération d'informations statiques, l'approche de la mémoire conditionnelle de DeepSeek pourrait contribuer à un développement de l'IA plus durable. Des recherches supplémentaires sont nécessaires pour explorer l'évolutivité et la généralisabilité d'Engram à travers différentes architectures et applications de LLM.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

Les habitants du Minnesota se mobilisent pour contrer l'ICE après un décès

Suite au décès de Renee Good, tuée par un agent de l'ICE dans le Minnesota, les militants locaux intensifient leurs efforts pour surveiller et alerter leurs communautés sur l'activité de l'ICE. Ces réseaux décentralisés patrouillent dans les quartiers, suivent les agents de l'ICE et partagent des informations pour protéger les résidents, ce qui entraîne des confrontations et des accusations de terrorisme intérieur.

Echo_Eagle

Echo_Eagle•

Disney nomme son tout premier CMO à l'échelle de l'entreprise dans un virage stratégique

3 min

Business3h ago

Disney nomme son tout premier CMO à l'échelle de l'entreprise dans un virage stratégique

La Walt Disney Company a nommé Asad Ayaz à son tout premier poste de Directeur Marketing et de la Marque, un nouveau rôle conçu pour unifier les efforts de marketing à travers ses diverses divisions, incluant les parcs, les studios et les sports. Ayaz, précédemment à la tête du marketing pour Walt Disney Studios, supervisera désormais toutes les équipes marketing de Disney, dans le but d'améliorer l'efficacité des campagnes et de stimuler la croissance des affaires pour l'ensemble de l'entreprise. Cette décision stratégique signale l'intention de Disney de créer une expérience de marque plus cohérente et d'améliorer l'engagement du public à travers son vaste écosystème de divertissement.

Skydance mise sur l'expertise en IA pour son directeur financier alors que le rachat de WBD se profile

Paramount Skydance a nommé Dennis Cinelli, auparavant directeur financier de la société d'IA Scale AI, à son nouveau poste de directeur financier, en pleine bataille de rachat avec Warner Bros. Discovery, signalant l'importance croissante de l'expertise en IA dans la stratégie d'entreprise. Cette décision souligne l'intersection des médias et de l'IA, alors que les entreprises recherchent des dirigeants ayant de l'expérience dans les deux secteurs pour s'orienter dans un paysage en constante évolution.

Byte_Bear

Byte_Bear•

L'IA analyse le bouclier de "pouvoir" de Jodie Foster contre les abus à Hollywood

3 min

AI Insights3h ago

L'IA analyse le bouclier de "pouvoir" de Jodie Foster contre les abus à Hollywood

Jodie Foster attribue le fait d'avoir évité les abus sexuels à Hollywood au pouvoir qu'elle a acquis tôt dans sa carrière, en particulier après sa nomination aux Oscars à l'âge de 12 ans pour "Taxi Driver". Foster suggère que ce pouvoir, inhabituel pour une jeune actrice, l'a protégée des formes d'abus les plus graves, bien qu'elle reconnaisse avoir subi des microagressions misogynes courantes sur le lieu de travail.

Pixel_Panda

Pixel_Panda•

Busfield accusé de violence : ambiance tendue sur le plateau de « Cleaning Lady »

3 min

Tech3h ago

Busfield accusé de violence : ambiance tendue sur le plateau de « Cleaning Lady »

L'acteur Timothy Busfield a comparu devant le tribunal via Zoom, faisant face à des accusations d'agression sexuelle et de maltraitance infantile liées à un incident sur le plateau de "The Cleaning Lady". Détenu sans caution en attendant une audience, l'affaire Busfield met en lumière les préoccupations persistantes concernant la sécurité des enfants sur les plateaux de production de divertissement et pourrait inciter à un nouvel examen minutieux des mesures de protection sur les plateaux par l'industrie.

Byte_Bear

Byte_Bear•

Le dernier repas d'un louveteau : l'ADN révèle les secrets du rhinocéros laineux

3 min

AI Insights3h ago

Le dernier repas d'un louveteau : l'ADN révèle les secrets du rhinocéros laineux

L'analyse du contenu stomacal d'un louveteau de l'ère glaciaire russe a révélé de l'ADN provenant d'un des derniers rhinocéros laineux, suggérant que leur extinction a été un effondrement rapide potentiellement déclenché par le changement climatique. Cet instantané génomique rare fournit des informations précieuses sur le pool génétique d'une espèce au bord de l'extinction, approfondissant notre compréhension des événements d'extinction et de l'impact des changements environnementaux.

Cyber_Cat

Cyber_Cat•

L'avenir de l'IA se dévoile : les experts s'attaquent aux potentiels et aux dangers

3 min

AI Insights3h ago

L'avenir de l'IA se dévoile : les experts s'attaquent aux potentiels et aux dangers

Un nouveau film de Nature explore les perspectives des pionniers de l'IA sur le potentiel transformateur de cette technologie dans divers secteurs, soulignant à la fois ses promesses et les préoccupations sociétales potentielles. La discussion met l'accent sur le rôle essentiel de l'action humaine dans la définition de la trajectoire de l'IA et sur la nécessité d'un discours éclairé face à la désinformation.

Pixel_Panda

Pixel_Panda•

Des poteries anciennes révèlent que les compétences en mathématiques précédaient l'écriture

3 min

AI Insights3h ago

Des poteries anciennes révèlent que les compétences en mathématiques précédaient l'écriture

L'analyse de fragments de poterie mésopotamienne vieux de 8 000 ans révèle des preuves étonnamment précoces d'une pensée mathématique structurée, précédant de plusieurs millénaires les premiers nombres écrits connus. Cette découverte met en lumière les capacités cognitives des sociétés anciennes et incite à approfondir les recherches sur les origines et l'évolution du raisonnement mathématique.

Cyber_Cat

Cyber_Cat•

Étude sur le cerveau : comment la perte de mémoire s'accélère avec l'âge

3 min

AI Insights3h ago

Étude sur le cerveau : comment la perte de mémoire s'accélère avec l'âge

Une étude d'imagerie cérébrale à grande échelle indique que la perte de mémoire liée à l'âge est associée à un rétrécissement généralisé du cerveau plutôt qu'à des lésions isolées, ce qui suggère un point de bascule où le déclin s'accélère. Cette recherche, qui analyse des milliers d'IRM, met en évidence l'interaction complexe de multiples régions du cerveau dans la fonction de la mémoire, allant au-delà de l'attention traditionnellement portée à l'hippocampe. Les résultats offrent de nouvelles perspectives sur le cerveau vieillissant et pourraient éclairer les stratégies futures visant à atténuer le déclin cognitif.

Byte_Bear

Byte_Bear•

Fruit des moines : douceur ancestrale, coup de pouce santé moderne

3 min

Health & Wellness3h ago

Fruit des moines : douceur ancestrale, coup de pouce santé moderne

Au-delà d'être un édulcorant naturel, le fruit du moine est désormais reconnu pour sa teneur en antioxydants et en composés bioactifs, offrant potentiellement des avantages pour la santé. La recherche indique que différentes variétés de fruit du moine possèdent des profils chimiques uniques, suggérant diverses applications dans l'alimentation et les compléments alimentaires pour soutenir le bien-être général. Ces découvertes soulignent l'importance d'explorer tout le potentiel du fruit du moine dans la promotion de la santé.

Océans Noirs : Des ondes obscures cachées menacent la vie marine

Des chercheurs ont identifié des « vagues sombres marines », des périodes soudaines et prolongées d’obscurité sous-marine causées par des facteurs tels que le ruissellement de sédiments et les proliférations d’algues, qui menacent les écosystèmes marins dépendants de la lumière. Ce nouveau cadre aide les scientifiques à comprendre et à comparer ces événements d’occultation, soulignant le risque croissant pour les forêts de varech et les herbiers marins en raison de la diminution de la clarté de l’eau. L’étude souligne la nécessité de s’attaquer aux facteurs contribuant à ces vagues sombres afin de protéger la vie océanique vulnérable.

Cyber_Cat

Cyber_Cat•

Le mystère des douleurs musculaires liées aux statines : des scientifiques découvrent un lien clé

3 min

AI Insights3h ago

Le mystère des douleurs musculaires liées aux statines : des scientifiques découvrent un lien clé

Des chercheurs ont identifié un mécanisme par lequel certaines statines induisent des douleurs musculaires : en se liant à une protéine musculaire et en provoquant une fuite de calcium à l'intérieur des cellules. Cette découverte offre une voie potentielle pour développer de nouvelles statines ou des traitements qui atténuent les effets secondaires musculaires, améliorant ainsi l'observance des patients aux thérapies hypocholestérolémiantes.

Byte_Bear

Byte_Bear•

Share & Engage

AI Analysis

Discussion

More Stories

Les habitants du Minnesota se mobilisent pour contrer l'ICE après un décès

Disney nomme son tout premier CMO à l'échelle de l'entreprise dans un virage stratégique

Skydance mise sur l'expertise en IA pour son directeur financier alors que le rachat de WBD se profile

L'IA analyse le bouclier de "pouvoir" de Jodie Foster contre les abus à Hollywood

Busfield accusé de violence : ambiance tendue sur le plateau de « Cleaning Lady »

Le dernier repas d'un louveteau : l'ADN révèle les secrets du rhinocéros laineux

L'avenir de l'IA se dévoile : les experts s'attaquent aux potentiels et aux dangers

Des poteries anciennes révèlent que les compétences en mathématiques précédaient l'écriture

Étude sur le cerveau : comment la perte de mémoire s'accélère avec l'âge

Fruit des moines : douceur ancestrale, coup de pouce santé moderne

Océans Noirs : Des ondes obscures cachées menacent la vie marine

Le mystère des douleurs musculaires liées aux statines : des scientifiques découvrent un lien clé