Nvidia reveló una nueva técnica para reducir los costos de memoria del razonamiento de los modelos de lenguaje grandes (LLM) hasta ocho veces, mientras que OpenAI desplegó chips Cerebras para la generación de código "casi instantánea", lo que marca un alejamiento significativo de su dependencia tradicional de Nvidia. Estos desarrollos se producen en medio de una oleada de actividad en los sectores de la IA y la tecnología, incluyendo un hito en la energía de fusión y el éxito de una startup sin aumentar la plantilla.
La nueva técnica de Nvidia, llamada esparcimiento dinámico de memoria (DMS), comprime la caché de valor clave (KV), la memoria temporal que los LLM utilizan para procesar indicaciones y razonar a través de problemas, según VentureBeat. Los experimentos demostraron que DMS permite a los LLM "pensar" más tiempo y explorar más soluciones sin aumentar las demandas de memoria. Mientras tanto, OpenAI lanzó GPT-5.3-Codex-Spark, un modelo de codificación diseñado para tiempos de respuesta rápidos, que funciona con hardware de Cerebras Systems. Esta asociación representa la primera colaboración importante de inferencia de OpenAI fuera de Nvidia, según informó VentureBeat.
La industria tecnológica también está experimentando avances en otras áreas. Helion Energy, un desarrollador de energía de fusión presidido por Sam Altman, anunció un hito al alcanzar temperaturas récord de plasma a 150 millones de grados Celsius, diez veces el núcleo del sol. Este logro es parte del objetivo de Helion de llevar energía a la red en el estado de Washington para 2028, según informó Fortune. Sin embargo, algunos siguen siendo escépticos sobre el cronograma y el enfoque tecnológico de Helion.
En otras noticias, la startup Abacum, recaudó más de $100 millones y triplicó sus ingresos sin aumentar la plantilla, según Fortune. La empresa optó por evitar la contratación, optando en cambio por abordar los problemas subyacentes.
Además de estos desarrollos, la empresa Asimov (YC W26) está contratando para un puesto remoto. La empresa está construyendo datos de entrenamiento para robots humanoides mediante la recopilación de video egocéntrico de personas realizando tareas cotidianas. Según Hacker News, el puesto implica usar un teléfono montado en una diadema mientras se realizan actividades diarias.
Discussion
AI Experts & Community
Be the first to comment