Modelo de IA Otimiza Kernels de GPU Mais Rápido que Especialistas Humanos
Uma nova técnica desenvolvida por pesquisadores de Stanford, Nvidia e Together AI alcançou um avanço significativo na inteligência artificial ao otimizar um kernel de GPU crítico para rodar duas vezes mais rápido que o estado da arte anterior, que foi escrito por especialistas humanos, de acordo com a VentureBeat. A técnica, chamada Test-Time Training to Discover (TTT-Discover), desafia a abordagem convencional de permitir que os modelos tenham mais tempo para raciocínio.
A TTT-Discover permite que o modelo continue treinando durante o processo de inferência, atualizando seus pesos para o problema específico em questão, reportou a VentureBeat. Essa abordagem contrasta com as atuais estratégias de IA empresarial que frequentemente dependem de modelos "congelados", onde os parâmetros do modelo permanecem fixos, independentemente de ser um modelo de raciocínio fechado ou aberto.
Em notícias relacionadas à IA, a comunidade de IA acompanha de perto o progresso de grandes modelos de linguagem de empresas como OpenAI, Google e Anthropic. A MIT Technology Review observou que a comunidade prende a respiração a cada novo lançamento até que a METR (Model Evaluation Threat Research), uma organização sem fins lucrativos de pesquisa em IA, atualize seu gráfico que rastreia as capacidades de IA. Este gráfico, lançado pela primeira vez em março do ano passado, sugere que certas capacidades de IA estão se desenvolvendo a uma taxa exponencial, e modelos recentes como o Claude Opus 4.5 excederam essa tendência.
Em outras notícias de ciência, uma equipe de geólogos descobriu evidências de que duas antigas estruturas ultraquentes do tamanho de continentes, escondidas sob a Terra, influenciaram o campo magnético do planeta nos últimos 265 milhões de anos, reportou a Wired. Essas massas, conhecidas como grandes províncias de baixa velocidade de cisalhamento (LLSVPs), estão entre os objetos mais enormes e enigmáticos do planeta. As estimativas atuais sugerem que cada uma é comparável em tamanho ao continente africano, enterrada a uma profundidade de 2.900 quilômetros. De acordo com a Wired, essas regiões de velocidade vertical de superfície baixa (LLVV) formam áreas irregulares do manto da Terra, com material mais quente, denso e quimicamente diferente do manto circundante.
Também ganhando manchetes está o tópico da energia nuclear de próxima geração. A MIT Technology Review abordou questões sobre energia nuclear avançada, data centers de IA em hiperescala e a rede em uma recente mesa redonda online. Uma questão chave girava em torno das necessidades de combustível para reatores nucleares de próxima geração. Muitos desses reatores não usam o urânio pouco enriquecido encontrado em reatores convencionais, levantando questões sobre considerações da cadeia de suprimentos.
Discussion
AI Experts & Community
Be the first to comment