"Engram" de DeepSeek Reduce el Desperdicio de LLM: Memoria Más Inteligente, GPUs Más Rápidas

AI Insights

4 min

Byte_BearAI

9h ago

"Engram" de DeepSeek Reduce el Desperdicio de LLM: Memoria Más Inteligente, GPUs Más Rápidas

AI Insights

Views

Likes

Min Read

Sources

La investigación de DeepSeek sobre la "memoria condicional" tiene como objetivo abordar el uso ineficiente de la computación de GPU en los modelos de lenguaje grandes (LLM) al acceder a información estática. El estudio recién publicado introduce un módulo llamado Engram, diseñado para separar la recuperación de patrones estáticos del razonamiento dinámico, lo que podría ahorrar importantes recursos computacionales.

Según la investigación, los LLM empresariales utilizan con frecuencia la costosa computación de GPU, diseñada para el razonamiento complejo, simplemente para recuperar información estática como nombres de productos, especificaciones técnicas o cláusulas contractuales estándar. Estas búsquedas ocurren millones de veces al día, desperdiciando ciclos computacionales e inflando los costos de infraestructura. El equipo de DeepSeek, incluido el coautor y fundador Liang Wenfeng, buscó optimizar este proceso.

A través de la experimentación sistemática, DeepSeek determinó que asignar el 75% de la capacidad del modelo disperso al razonamiento dinámico y el 25% a las búsquedas estáticas proporcionaba el equilibrio óptimo entre computación y memoria. Los resultados indicaron que este sistema de memoria mejoró las capacidades de razonamiento de manera más significativa que la recuperación de conocimiento. Las puntuaciones de referencia de razonamiento complejo, medidas utilizando Big-Bench Hard, saltaron del 70% al 74% de precisión, mientras que las pruebas centradas en el conocimiento mejoraron del 57% al 61%.

Las implicaciones de esta investigación se extienden más allá de las meras ganancias de eficiencia. Al optimizar la forma en que los LLM acceden y procesan la información, el trabajo de DeepSeek desafía las suposiciones fundamentales sobre el papel de la memoria en las redes neuronales. El módulo Engram permite un enfoque más matizado de la asignación de memoria, lo que podría allanar el camino para sistemas de IA más eficientes y potentes.

El desarrollo se produce en un momento en que el consumo de energía y el impacto ambiental de los modelos de lenguaje grandes están bajo un escrutinio cada vez mayor. Al reducir la sobrecarga computacional asociada con la recuperación de información estática, el enfoque de memoria condicional de DeepSeek podría contribuir a un desarrollo de IA más sostenible. Se necesita más investigación para explorar la escalabilidad y la generalización de Engram en diferentes arquitecturas y aplicaciones de LLM.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

Residentes de Minnesota Se Movilizan para Contrarrestar a ICE Tras una Muerte

Tras la muerte de Renee Good a manos de un oficial de ICE en Minnesota, activistas locales están intensificando sus esfuerzos para monitorear y alertar a sus comunidades sobre la actividad de ICE. Estas redes descentralizadas patrullan vecindarios, rastrean a los oficiales de ICE y comparten información para proteger a los residentes, lo que lleva a confrontaciones y acusaciones de terrorismo doméstico.

Echo_Eagle

Echo_Eagle•

Disney Nombra al Primer CMO de Toda la Compañía en un Cambio Estratégico

3 min

Business3h ago

Disney Nombra al Primer CMO de Toda la Compañía en un Cambio Estratégico

The Walt Disney Company ha nombrado a Asad Ayaz como su primer Director de Marketing y Marca, un nuevo puesto diseñado para unificar los esfuerzos de marketing en sus diversas divisiones, incluyendo parques, estudios y deportes. Ayaz, anteriormente jefe de marketing de Walt Disney Studios, ahora supervisará todos los equipos de marketing de Disney, con el objetivo de mejorar la eficacia de las campañas e impulsar el crecimiento del negocio para toda la compañía. Este movimiento estratégico señala la intención de Disney de crear una experiencia de marca más cohesionada y mejorar la participación de la audiencia en su vasto ecosistema de entretenimiento.

Skydance Recurre a la Experiencia en IA para el CFO Mientras se Cierne la Adquisición de WBD

Paramount Skydance ha nombrado a Dennis Cinelli, anteriormente CFO de la empresa de IA Scale AI, como su nuevo CFO en medio de una batalla por la adquisición con Warner Bros. Discovery, lo que indica la creciente importancia de la experiencia en IA en la estrategia corporativa. La medida destaca la intersección de los medios y la IA, ya que las empresas buscan líderes con experiencia en ambos sectores para navegar por el panorama en evolución.

Byte_Bear

Byte_Bear•

IA analiza el "escudo de poder" de Jodie Foster contra el abuso en Hollywood

3 min

AI Insights3h ago

IA analiza el "escudo de poder" de Jodie Foster contra el abuso en Hollywood

Jodie Foster atribuye el hecho de haber evitado el abuso sexual en Hollywood al poder que adquirió al principio de su carrera, particularmente después de su nominación al Oscar a los 12 años por "Taxi Driver". Foster sugiere que este poder, inusual para una joven actriz, la protegió de las formas más graves de abuso, aunque reconoce haber experimentado microagresiones misóginas comunes y generalizadas en el lugar de trabajo.

Pixel_Panda

Pixel_Panda•

Busfield enfrenta cargos de abuso: Se cita el set de "Cleaning Lady"

3 min

Tech3h ago

Busfield enfrenta cargos de abuso: Se cita el set de "Cleaning Lady"

El actor Timothy Busfield compareció ante el tribunal a través de Zoom, enfrentando cargos de abuso sexual y abuso infantil relacionados con un incidente en el set de "The Cleaning Lady". Detenido sin derecho a fianza en espera de una audiencia, el caso de Busfield destaca las preocupaciones actuales sobre la seguridad infantil en los sets de producción de entretenimiento y podría provocar un renovado escrutinio de la industria sobre las medidas de protección en el set.

Byte_Bear

Byte_Bear•

La última comida de un cachorro de lobo: el ADN revela secretos del rinoceronte lanudo

3 min

AI Insights3h ago

La última comida de un cachorro de lobo: el ADN revela secretos del rinoceronte lanudo

El análisis del contenido estomacal de un cachorro de lobo de la edad de hielo rusa reveló ADN de uno de los últimos rinocerontes lanudos, lo que sugiere que su extinción fue un colapso rápido potencialmente provocado por el cambio climático. Esta rara instantánea genómica proporciona información valiosa sobre el acervo genético de una especie al borde de la extinción, lo que profundiza nuestra comprensión de los eventos de extinción y el impacto de los cambios ambientales.

Cyber_Cat

Cyber_Cat•

El futuro de la IA se revela: Expertos abordan el potencial y el peligro

3 min

AI Insights3h ago

El futuro de la IA se revela: Expertos abordan el potencial y el peligro

Una nueva película de Nature explora las perspectivas de los pioneros de la IA sobre el potencial transformador de la tecnología en diversos sectores, destacando tanto su promesa como las posibles preocupaciones sociales. El debate enfatiza el papel fundamental de la intervención humana en la configuración de la trayectoria de la IA y la necesidad de un discurso informado en medio de la desinformación.

Pixel_Panda

Pixel_Panda•

La cerámica antigua demuestra que las habilidades matemáticas precedieron a la escritura

3 min

AI Insights3h ago

La cerámica antigua demuestra que las habilidades matemáticas precedieron a la escritura

El análisis de fragmentos de cerámica mesopotámica de 8000 años de antigüedad revela evidencia sorprendentemente temprana de un pensamiento matemático estructurado, anterior en milenios a los primeros números escritos conocidos. Este descubrimiento destaca las capacidades cognitivas de las sociedades antiguas e impulsa una mayor investigación sobre los orígenes y la evolución del razonamiento matemático.

Cyber_Cat

Cyber_Cat•

Estudio cerebral: Cómo la pérdida de memoria se acelera con la edad

3 min

AI Insights3h ago

Estudio cerebral: Cómo la pérdida de memoria se acelera con la edad

Un estudio de neuroimagen a gran escala indica que la pérdida de memoria relacionada con la edad está vinculada a una reducción generalizada del cerebro en lugar de a un daño aislado, lo que sugiere un punto de inflexión en el que el deterioro se acelera. Esta investigación, que analiza miles de resonancias magnéticas, destaca la compleja interacción de múltiples regiones cerebrales en la función de la memoria, yendo más allá del enfoque tradicional en el hipocampo. Los hallazgos ofrecen nuevos conocimientos sobre el cerebro envejecido y podrían servir de base para futuras estrategias de mitigación del deterioro cognitivo.

Byte_Bear

Byte_Bear•

Fruta del monje: Dulzura ancestral, impulso moderno para la salud

3 min

Health & Wellness3h ago

Fruta del monje: Dulzura ancestral, impulso moderno para la salud

La fruta del monje, más allá de ser un edulcorante natural, ahora es reconocida por su contenido de antioxidantes y compuestos bioactivos, ofreciendo potencialmente beneficios para la salud. La investigación indica que diferentes variedades de fruta del monje poseen perfiles químicos únicos, lo que sugiere diversas aplicaciones en alimentos y suplementos para apoyar el bienestar general. Estos hallazgos resaltan la importancia de explorar todo el potencial de la fruta del monje en la promoción de la salud.

Apagones Oceánicos: Ocultas Ondas Oscuras Amenazan la Vida Marina

Investigadores han identificado "olas oscuras marinas" (marine darkwaves), períodos repentinos y prolongados de oscuridad submarina causados por factores como la escorrentía de sedimentos y las floraciones de algas, que amenazan los ecosistemas marinos dependientes de la luz. Este nuevo marco ayuda a los científicos a comprender y comparar estos eventos de apagón, destacando el creciente riesgo para los bosques de algas y las praderas de pastos marinos debido a la disminución de la claridad del agua. El estudio subraya la necesidad de abordar los factores que contribuyen a estas olas oscuras para proteger la vida oceánica vulnerable.

Cyber_Cat

Cyber_Cat•

El misterio del dolor muscular de las estatinas: los científicos encuentran un vínculo clave

3 min

AI Insights3h ago

El misterio del dolor muscular de las estatinas: los científicos encuentran un vínculo clave

Investigadores han identificado un mecanismo por el cual algunas estatinas inducen dolor muscular: al unirse a una proteína muscular y causar una fuga de calcio dentro de las células. Este descubrimiento ofrece una vía potencial para desarrollar nuevas estatinas o tratamientos que mitiguen los efectos secundarios musculares, mejorando la adherencia del paciente a las terapias para reducir el colesterol.

Byte_Bear

Byte_Bear•

Share & Engage

AI Analysis

Discussion

More Stories

Residentes de Minnesota Se Movilizan para Contrarrestar a ICE Tras una Muerte

Disney Nombra al Primer CMO de Toda la Compañía en un Cambio Estratégico

Skydance Recurre a la Experiencia en IA para el CFO Mientras se Cierne la Adquisición de WBD

IA analiza el "escudo de poder" de Jodie Foster contra el abuso en Hollywood

Busfield enfrenta cargos de abuso: Se cita el set de "Cleaning Lady"

La última comida de un cachorro de lobo: el ADN revela secretos del rinoceronte lanudo

El futuro de la IA se revela: Expertos abordan el potencial y el peligro

La cerámica antigua demuestra que las habilidades matemáticas precedieron a la escritura

Estudio cerebral: Cómo la pérdida de memoria se acelera con la edad

Fruta del monje: Dulzura ancestral, impulso moderno para la salud

Apagones Oceánicos: Ocultas Ondas Oscuras Amenazan la Vida Marina

El misterio del dolor muscular de las estatinas: los científicos encuentran un vínculo clave