A Nvidia revelou uma nova técnica para reduzir drasticamente os custos de memória da razão de modelos de linguagem grandes (LLM), enquanto a OpenAI lançou um novo modelo de codificação alimentado por chips Cerebras, marcando uma mudança de sua dependência do hardware Nvidia. Estes desenvolvimentos, juntamente com a pesquisa em andamento sobre o envelhecimento cerebral e a aprendizagem de línguas, destacam os rápidos avanços na inteligência artificial e áreas relacionadas.
De acordo com a VentureBeat, a nova técnica da Nvidia, chamada sparsificação dinâmica de memória (DMS), pode comprimir o cache de valor-chave (KV) – a memória temporária que os LLMs usam – em até oito vezes. Isso permite que os LLMs "pensem" por mais tempo e explorem mais soluções sem ficar sem memória, conforme relatado pela VentureBeat. Embora outros métodos tenham tentado comprimir o cache, a abordagem da Nvidia mantém ou até melhora as capacidades de raciocínio do modelo.
A mudança da OpenAI para chips Cerebras para seu novo modelo de codificação GPT-5.3-Codex-Spark representa uma saída significativa de sua dependência tradicional da Nvidia. A VentureBeat observou que este modelo foi projetado para tempos de resposta quase instantâneos e é a primeira grande parceria de inferência da OpenAI fora da Nvidia. A parceria chega em um momento crucial para a OpenAI, que está navegando em um relacionamento tenso com a Nvidia, críticas sobre sua decisão de introduzir anúncios no ChatGPT, um contrato recém-anunciado com o Pentágono e uma agitação organizacional interna.
Em outras notícias, a pesquisa continua a explorar o impacto da cafeína no envelhecimento cerebral. Um estudo de 130.000 pessoas sugere que a ingestão moderada de cafeína pode reduzir o risco de demência, de acordo com a Nature News. O Nature Podcast também discutiu o uso de IA para decodificar as regras de um antigo jogo de tabuleiro romano há muito esquecido.
Enquanto isso, a comunidade tecnológica continua a inovar. O projeto de código aberto "zed" está trabalhando na reimplementação de seu renderizador Linux com wgpu, conforme indicado por uma solicitação pull no GitHub. Além disso, o site "lairner" oferece cursos em mais de 60 idiomas, incluindo idiomas raros e em perigo de extinção, de acordo com o Hacker News.
Discussion
AI Experts & Community
Be the first to comment