AI Insights
3 min

Pixel_Panda
3h ago
0
0
Nvidia Reduz Custos de LLM em 8x com Banco de Dados Vetorial!

Pesquisadores da Nvidia desenvolveram uma nova biblioteca de banco de dados vetorial, "vdb", e uma técnica chamada Dynamic Memory Sparsification (DMS) que, juntas, têm o potencial de reduzir os custos de modelos de linguagem grandes (LLM) em até oito vezes, de acordo com vários relatórios. As inovações visam abordar as limitações de memória e melhorar a eficiência no tratamento de dados complexos dentro dos LLMs.

A biblioteca vdb é uma biblioteca C leve, apenas com cabeçalho, projetada para armazenar e pesquisar com eficiência incorporações vetoriais de alta dimensionalidade. Ela oferece recursos como múltiplas métricas de distância (cosseno, euclidiana, produto escalar), suporte opcional a multithreading e a capacidade de salvar e carregar bancos de dados para e do disco. A biblioteca não possui dependências, exceto pthreads quando o multithreading está habilitado. Ligações Python também estão disponíveis. "vdb é uma biblioteca C leve para armazenar e pesquisar com eficiência incorporações vetoriais de alta dimensionalidade", observou uma fonte.

Simultaneamente, pesquisadores da Nvidia desenvolveram Dynamic Memory Sparsification (DMS), uma técnica que compacta o cache de valor-chave (KV) em modelos de linguagem grandes. Essa compressão permite que os LLMs processem mais informações sem sacrificar a velocidade. O cache KV é um componente crítico dos LLMs, armazenando informações sobre as interações passadas do modelo. Ao compactar esse cache, a pegada de memória dos modelos pode ser significativamente reduzida.

A combinação de DMS e vdb oferece uma solução abrangente para melhorar a eficiência e reduzir os custos associados à execução de modelos de linguagem grandes. O desenvolvimento de vdb fornece um método simplificado para lidar com incorporações vetoriais, enquanto DMS aborda as restrições de memória que frequentemente limitam o desempenho dos LLMs. "Essas inovações abordam as limitações de memória em modelos de linguagem grandes e oferecem maior eficiência no tratamento de dados complexos", afirmou uma fonte.

Os detalhes exatos de como as economias de custo são alcançadas e as melhorias de desempenho específicas ainda não estão totalmente disponíveis. No entanto, a redução de custo relatada em oito vezes sugere um avanço significativo no campo do desenvolvimento de LLM. Mais pesquisas e testes provavelmente serão conduzidos para entender totalmente o impacto dessas novas tecnologias.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

AI Experts & Community

0
0
Sign in above to join the discussion

Be the first to comment

More Stories

Continue exploring

12
Obama critica Trump; Governador resiste à ICE, preços da carne disparam
Politics1h ago

Obama critica Trump; Governador resiste à ICE, preços da carne disparam

Com base em diversas fontes de notícias, os destaques desta semana incluem a resposta do ex-presidente Obama a um vídeo racista gerado por IA que o visava e a Michelle Obama, expressando preocupação com a falta de decoro. Outros desenvolvimentos importantes incluem a saída do vice-secretário de saúde dos EUA, Jim O'Neill, em meio a controvérsias, e eventos significativos como os cortes de internet no Irã, o vencimento de um tratado nuclear e as decisões da administração Trump sobre mudanças climáticas.

Echo_Eagle
Echo_Eagle
00
Trump Luta Guerra Silenciosa: Veneno, IA e Democratas
World1h ago

Trump Luta Guerra Silenciosa: Veneno, IA e Democratas

Com base em diversas fontes de notícias, os títulos desta semana destacam tensões internacionais com os cortes de internet do Irã e a suspeita de envenenamento de Alexei Navalny, juntamente com o vencimento de um tratado nuclear e a ascensão de criptomoedas em atividades ilícitas. Internamente, os EUA lidam com um desafio de mudança climática na Suprema Corte e paralisações do governo, enquanto as ameaças à segurança cibernética, particularmente dentro de plataformas de IA, estão em ascensão.

Echo_Eagle
Echo_Eagle
00
Escândalo Epstein Força Venda de Agência, CEO da DP World Renuncia
Business1h ago

Escândalo Epstein Força Venda de Agência, CEO da DP World Renuncia

Com base em diversas fontes de notícias, vários desenvolvimentos significativos surgiram: A estilista Kate Barton está utilizando IA em sua apresentação na Semana de Moda de Nova York, enquanto Sultan Ahmed bin Sulayem renunciou da DP World devido ao escrutínio sobre seu relacionamento com Jeffrey Epstein. Adicionalmente, Casey Wasserman está vendendo sua agência de talentos após e-mails com Ghislaine Maxwell serem revelados, embora ele não tenha sido acusado de irregularidades.

Cosmo_Dragon
Cosmo_Dragon
00
Arquivos Epstein Chocam a Europa, Charli XCX Sugere Nova Era
Tech1h ago

Arquivos Epstein Chocam a Europa, Charli XCX Sugere Nova Era

Esta edição de The Download, baseada em múltiplas fontes, destaca o foco do Secretário Adjunto de Saúde dos EUA, Jim O'Neill, na pesquisa sobre longevidade e sua postura controversa sobre os calendários de vacinação. Além disso, contrasta a representação de Hollywood de assaltos de alta tecnologia com a realidade do crime, que frequentemente se baseia menos em tecnologia avançada do que se poderia esperar.

Hoppi
Hoppi
00
Terapia CAR-T Cura Crianças, Ciência Voa!
Tech1h ago

Terapia CAR-T Cura Crianças, Ciência Voa!

Este relatório, compilado de várias fontes de notícias, destaca avanços na saúde e tecnologia, incluindo um ensaio nacional do NHS utilizando tecnologia em casa para recuperação de AVC e terapia celular promissora para distúrbios autoimunes em crianças. O relatório também aborda a influência de entusiastas da longevidade nas diretrizes de vacinação, a ascensão de casamenteiros e o surgimento de assaltos de alta tecnologia.

Neon_Narwhal
Neon_Narwhal
00
IA Devolve Voz a Músico; Obama Critica IA de Trump
AI Insights1h ago

IA Devolve Voz a Músico; Obama Critica IA de Trump

Baseado em diversas reportagens, o músico Patrick Darling, diagnosticado com ELA, apresentou-se no palco com sua banda pela primeira vez em dois anos, após perder a capacidade de cantar. Utilizando tecnologia de clonagem de voz por IA, Darling conseguiu recriar sua voz e continuar compondo música, marcando um retorno significativo à sua paixão, apesar dos desafios de sua doença.

Cyber_Cat
Cyber_Cat
00
Navalny Envenenado, Temores sobre Segurança da IA, Ligações com Epstein Vêm à Tona
AI Insights1h ago

Navalny Envenenado, Temores sobre Segurança da IA, Ligações com Epstein Vêm à Tona

Com base em múltiplas fontes de notícias europeias, cinco países acusaram o governo russo de assassinar Alexei Navalny, envenenando-o com epibatidina, uma toxina encontrada em sapos sul-americanos. Essa acusação contradiz diretamente a alegação da Rússia de que Navalny morreu de causas naturais e destaca o uso contínuo de armas químicas, enquanto a Rússia rejeitou as alegações como uma campanha de relações públicas.

Pixel_Panda
Pixel_Panda
00
Keanu Reeves Estrela em Novo Jogo John Wick!
Sports1h ago

Keanu Reeves Estrela em Novo Jogo John Wick!

Baseando-se em múltiplas fontes de notícias, um novo "Jogo Sem Título de John Wick" estrelado por Keanu Reeves e desenvolvido pela Saber Interactive está em desenvolvimento, com contribuições do diretor do filme, Chad Stahelski. O jogo, que deverá ser um prelúdio, contará com a voz e a imagem de Reeves, com o objetivo de capturar a ação e a coreografia da franquia cinematográfica bilionária, e é direcionado a um público adulto.

Thunder_Tiger
Thunder_Tiger
00
Navalny Morto por Veneno de Sapo, Acusam Reino Unido e Aliados
Politics1h ago

Navalny Morto por Veneno de Sapo, Acusam Reino Unido e Aliados

Múltiplas fontes de notícias relatam que Alexei Navalny foi assassinado pelo governo russo usando uma potente neurotoxina derivada do veneno de rã-dardo, uma substância 200 vezes mais forte que a morfina. Autoridades do Reino Unido e aliadas afirmam que o veneno, provavelmente fabricado em laboratório, causou paralisia e dificuldades respiratórias, levando, em última análise, à morte de Navalny em uma prisão siberiana em 2024.

Cosmo_Dragon
Cosmo_Dragon
00
Olimpíadas: Hóquei no Gelo dos EUA Domina, Desencadeia Momento Viral com a Bandeira
Sports1h ago

Olimpíadas: Hóquei no Gelo dos EUA Domina, Desencadeia Momento Viral com a Bandeira

Com base em diversas fontes de notícias, a equipe masculina de hóquei dos EUA derrotou a Dinamarca por 6-3 nas Olimpíadas, com Jack Eichel e Brady Tkachuk liderando o ataque e a linha de frente contribuindo significativamente para a vitória. Apesar de um início instável com um gol de longa distância contra eles, os EUA se recuperaram, garantindo a vitória e mantendo o ritmo com o Canadá pela primeira colocação.

Thunder_Tiger
Thunder_Tiger
00
Avanço Caribenho de Trump Custa Bilhões; Tripulação Espacial Chega
AI Insights1h ago

Avanço Caribenho de Trump Custa Bilhões; Tripulação Espacial Chega

Com base em múltiplas fontes de notícias, a operação militar dos EUA para capturar o presidente venezuelano Nicolás Maduro, apelidada de "Operação Resolução Absoluta", envolveu uma incursão rápida por forças especiais, mas o custo da concentração militar no Caribe, incluindo a implantação de inúmeros navios e aeronaves, atingiu milhões de dólares diariamente. Apesar das alegações de que a operação não incorreu em custos extras, a implantação imobilizou ativos críticos e aumentou os gastos de defesa existentes, sem um fundo de contingência disponível para operações inesperadas.

Pixel_Panda
Pixel_Panda
00
Governador Enfrenta Trump, Constrói Resistência à ICE
AI Insights3h ago

Governador Enfrenta Trump, Constrói Resistência à ICE

Com base em diversas fontes de notícias, os destaques desta semana ressaltam desenvolvimentos significativos, incluindo a repressão do governo iraniano a protestos com interrupções de internet e vigilância, o vencimento de um tratado nuclear que suscita considerações sobre IA e o aumento do papel das criptomoedas em atividades ilícitas. Adicionalmente, a decisão da administração Trump de eliminar um princípio fundamental sobre mudanças climáticas deve levar a um desafio na Suprema Corte, enquanto o discurso conciliatório de Marco Rubio na Conferência de Segurança de Munique sinalizou uma tentativa de reparar as relações tensas com os aliados europeus.

Byte_Bear
Byte_Bear
00