Modelo de IA Optimiza Kernels de GPU Más Rápido Que Expertos Humanos
Una nueva técnica desarrollada por investigadores de Stanford, Nvidia y Together AI ha logrado un avance significativo en la inteligencia artificial al optimizar un kernel de GPU crítico para que se ejecute al doble de velocidad que el estado del arte anterior, que fue escrito por expertos humanos, según VentureBeat. La técnica, llamada Test-Time Training to Discover (TTT-Discover), desafía el enfoque convencional de permitir que los modelos tengan más tiempo para razonar.
TTT-Discover permite que el modelo continúe entrenando durante el proceso de inferencia, actualizando sus pesos para el problema específico en cuestión, informó VentureBeat. Este enfoque contrasta con las estrategias actuales de IA empresarial que a menudo se basan en modelos "congelados", donde los parámetros del modelo permanecen fijos, independientemente de si se trata de un modelo de razonamiento cerrado o abierto.
En noticias relacionadas con la IA, la comunidad de IA monitorea de cerca el progreso de los grandes modelos de lenguaje de empresas como OpenAI, Google y Anthropic. MIT Technology Review señaló que la comunidad contiene la respiración con cada nuevo lanzamiento hasta que METR (Model Evaluation Threat Research), una organización sin fines de lucro de investigación de IA, actualiza su gráfico que rastrea las capacidades de la IA. Este gráfico, publicado por primera vez en marzo del año pasado, sugiere que ciertas capacidades de la IA se están desarrollando a un ritmo exponencial, y modelos recientes como Claude Opus 4.5 han superado esa tendencia.
En otras noticias científicas, un equipo de geólogos ha descubierto evidencia de que dos antiguas estructuras ultra calientes del tamaño de un continente, ocultas debajo de la Tierra, han influido en el campo magnético del planeta durante los últimos 265 millones de años, informó Wired. Estas masas, conocidas como provincias de baja velocidad de corte grandes (LLSVPs), se encuentran entre los objetos más enormes y enigmáticos del planeta. Las estimaciones actuales sugieren que cada una es comparable en tamaño al continente africano, enterrada a una profundidad de 2.900 kilómetros. Según Wired, estas regiones de velocidad vertical de superficie baja (LLVV) forman áreas irregulares del manto terrestre, con material más caliente, denso y químicamente diferente al del manto circundante.
También es noticia el tema de la energía nuclear de próxima generación. MIT Technology Review abordó preguntas sobre la energía nuclear avanzada, los centros de datos de IA a hiperescala y la red en una reciente mesa redonda en línea. Una pregunta clave giró en torno a las necesidades de combustible para los reactores nucleares de próxima generación. Muchos de estos reactores no utilizan el uranio poco enriquecido que se encuentra en los reactores convencionales, lo que plantea interrogantes sobre las consideraciones de la cadena de suministro.
Discussion
AI Experts & Community
Be the first to comment