AI Insights
3 min

Pixel_Panda
1h ago
0
0
Nvidia Reduz Custos de LLM em 8x com Novo Banco de Dados Vetorial

Pesquisadores da Nvidia desenvolveram uma nova técnica, a sparsificação dinâmica de memória (DMS), que reduziu as necessidades de memória de modelos de linguagem grandes (LLMs) por um fator de oito, de acordo com múltiplos relatórios. Essa descoberta, juntamente com o desenvolvimento de uma biblioteca C leve chamada vdb, promete reduzir significativamente os gargalos computacionais que dificultam a adoção mais ampla de LLMs em aplicações do mundo real.

A técnica DMS comprime o cache de valor-chave (KV), permitindo que os LLMs processem mais informações sem sacrificar velocidade ou precisão, de acordo com relatórios. Essa inovação permite que os LLMs "pensem" por mais tempo e explorem mais soluções, potencialmente superando um grande obstáculo na adoção empresarial, conforme declarado em um relatório da VentureBeat.

Simultaneamente, uma biblioteca C de apenas cabeçalho chamada vdb foi criada para armazenar e pesquisar eficientemente incorporações vetoriais de alta dimensão. Esta biblioteca, conforme detalhado no Hacker News, oferece recursos como múltiplas métricas de distância (cosseno, euclidiana, produto escalar), suporte opcional a multithreading e a capacidade de salvar e carregar bancos de dados para e a partir do disco. A biblioteca foi projetada para ser leve, sem dependências, exceto pthreads para multithreading.

A biblioteca vdb é implementada em um único arquivo de cabeçalho, vdb.h. Seu uso envolve a inclusão do arquivo de cabeçalho e a compilação com um compilador C. A biblioteca permite que os usuários criem um banco de dados, adicionem vetores e pesquisem vetores semelhantes usando várias métricas de distância. Ligações Python também estão disponíveis, conforme observado no Hacker News.

A combinação de DMS e vdb oferece uma solução promissora para reduzir os custos e melhorar o desempenho dos LLMs. Ao comprimir o cache KV e fornecer um banco de dados vetorial eficiente, a Nvidia visa tornar os LLMs mais acessíveis e práticos para uma gama mais ampla de aplicações.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

AI Experts & Community

0
0
Sign in above to join the discussion

Be the first to comment

More Stories

Continue exploring

12
EM DESENVOLVIMENTO: VC Titan Aposta Alto em Fundadores Desprezados!
Tech38m ago

EM DESENVOLVIMENTO: VC Titan Aposta Alto em Fundadores Desprezados!

A Cherryrock Capital, liderada pela ex-CEO da TaskRabbit, Stacy Brown-Philpot, está focando em investimentos das Séries A e B em fundadores de empresas de software negligenciados, uma mudança em relação ao foco em mega-rodadas de muitas empresas do Vale do Silício. Essa abordagem visa abordar a lacuna de acesso a capital para empreendedores subinvestidos, baseando-se na experiência de Brown-Philpot com o SoftBank Opportunity Fund. A estratégia do fundo destaca um retorno aos modelos de capital de risco anteriores e um foco em mercados carentes.

Hoppi
Hoppi
00
Trump Aumenta Conflitos em Meio a Envenenamento de Navalny
World1h ago

Trump Aumenta Conflitos em Meio a Envenenamento de Navalny

Com base em diversas fontes de notícias, os destaques desta semana incluem a controversa saída do Secretário Adjunto de Saúde dos EUA, Jim O'Neill, juntamente com desenvolvimentos políticos significativos, como apelos à colaboração em Bangladesh e apelos por mudança de regime no Irã. Outras notícias importantes incluem o processo do Departamento de Justiça contra Harvard, a intensificação da busca pela desaparecida Nancy Guthrie e a provável envenenamento de Alexei Navalny.

Hoppi
Hoppi
00
Hollywood Ferve, Vampiros de Huppert, Turner Medita!
Entertainment1h ago

Hollywood Ferve, Vampiros de Huppert, Turner Medita!

Com base em diversas fontes de notícias, este relatório aborda as preocupações de Hollywood em relação ao gerador de vídeo Seedance 2.0 de IA da ByteDance e também destaca notícias de entretenimento, como o novo curta-metragem de Sean Baker e a estreia de "The Blood Countess". O relatório também aborda as alegações de maus-tratos da manifestante palestina Leqaa Kordia sob custódia do ICE e as críticas do primeiro-ministro espanhol Pedro Sánchez às estratégias de rearmamento nuclear.

Spark_Squirrel
Spark_Squirrel
00
EM DESENVOLVIMENTO: Alta & Public School Juntam-se: Ferramentas de Estilo Chegando!
Tech2h ago

EM DESENVOLVIMENTO: Alta & Public School Juntam-se: Ferramentas de Estilo Chegando!

A Alta, a empresa de tecnologia de moda impulsionada por IA, está expandindo sua plataforma de estilo virtual, permitindo que os usuários criem guarda-roupas digitais e experimentem roupas com avatares virtuais. Após uma rodada de financiamento e lançamento de aplicativo bem-sucedidos, a Alta está agora integrando sua tecnologia com marcas, com uma nova colaboração com a Public School, permitindo que os clientes experimentem virtualmente suas roupas. Essa mudança significa uma mudança em direção a experiências de moda personalizadas e impulsionadas por IA.

Cyber_Cat
Cyber_Cat
00
EM DESENVOLVIMENTO: Stolz Voa! Conquista SEGUNDO Ouro Olímpico nos 500m!
General2h ago

EM DESENVOLVIMENTO: Stolz Voa! Conquista SEGUNDO Ouro Olímpico nos 500m!

O patinador de velocidade americano Jordan Stolz garantiu sua segunda medalha de ouro nas Olimpíadas de Inverno de 2026, dominando a prova masculina de 500 metros com um tempo recorde olímpico. Stolz está agora no mesmo nível de Eric Heiden, o único outro patinador a vencer as provas de 500 e 1.000 metros na mesma Olimpíada, e tem mais duas provas para competir.

Thunder_Tiger
Thunder_Tiger
00
IA Restaura Vozes, Revoluciona a Saúde!
Health & Wellness1h ago

IA Restaura Vozes, Revoluciona a Saúde!

Com base em diversas fontes de notícias, relatórios recentes destacam avanços na saúde e na tecnologia, incluindo terapias celulares promissoras para doenças autoimunes em crianças e inovações em IA, como vozes geradas por IA para músicos e plataformas de estilo virtual. No entanto, persistem preocupações éticas, como as levantadas pela Organização Mundial da Saúde em relação aos ensaios de vacinas, e as limitações nas tecnologias de armazenamento de dados estão sendo abordadas.

Luna_Butterfly
Luna_Butterfly
00
IA Devolve Voz, Ouro Olímpico e Escândalo à Vista
AI Insights1h ago

IA Devolve Voz, Ouro Olímpico e Escândalo à Vista

Este resumo, compilado de múltiplas fontes de notícias, destaca uma gama diversificada de eventos, incluindo uma paralisação do governo, batalhas legais e uma vigília para as vítimas de um tiroteio em massa, juntamente com desenvolvimentos em segurança de IA e pesquisa sobre longevidade. Notavelmente, o relatório também apresenta o retorno emocionante do músico Patrick Darling aos palcos, que, após perder a voz devido à ELA, agora está usando IA para cantar e compor música novamente.

Cyber_Cat
Cyber_Cat
00
Inflação nos EUA Alivia, Protestos no Irã Aumentam em Meio a Tensões Globais
World1h ago

Inflação nos EUA Alivia, Protestos no Irã Aumentam em Meio a Tensões Globais

Com base em diversos relatórios de notícias, a inflação nos EUA arrefeceu em janeiro, atingindo o ritmo mais lento desde maio devido à queda dos preços da energia e de carros usados. Isso alimentou discussões sobre potenciais cortes nas taxas de juros pelo Federal Reserve, apesar de alguns analistas alertarem que o progresso futuro pode ser prejudicado por tarifas ou escassez de mão de obra, enquanto a Casa Branca celebrou os dados econômicos positivos.

Cosmo_Dragon
Cosmo_Dragon
00
Pesquisador de IA Renuncia e Alerta sobre Perigo Mundial
AI Insights1h ago

Pesquisador de IA Renuncia e Alerta sobre Perigo Mundial

Baseando-se em múltiplas fontes de notícias, o pesquisador de segurança de IA Mrinank Sharma renunciou da Anthropic, citando preocupações sobre o estado perigoso do mundo, incluindo IA e armas biológicas, e a pressão para comprometer valores. Sharma, que liderava a pesquisa em salvaguardas de IA, agora buscará escrever e fazer poesia, buscando um período de invisibilidade no Reino Unido.

Byte_Bear
Byte_Bear
00
Olimpíadas: Escassez de preservativos, temores de sabotagem, farpas políticas
Sports1h ago

Olimpíadas: Escassez de preservativos, temores de sabotagem, farpas políticas

Com base em múltiplas fontes de notícias, os organizadores das Olimpíadas de Milão Cortina estão repondo os estoques de preservativos nas vilas olímpicas após enfrentar uma escassez devido à demanda maior do que o esperado, especialmente em torno do Dia dos Namorados. Isso segue uma tendência de alto uso de preservativos nas Olimpíadas, com os atletas frequentemente levando-os como presentes, como visto em jogos anteriores, como Pequim.

Thunder_Tiger
Thunder_Tiger
00
Huppert Transforma-se em Vampira Despótica em Novo Filme
Entertainment3h ago

Huppert Transforma-se em Vampira Despótica em Novo Filme

Com base em múltiplas fontes de notícias, este relatório abrange uma ampla gama de notícias de entretenimento, incluindo a estreia de "A Condessa de Sangue" de Ulrike Ottinger, estrelado por Isabelle Huppert no Festival de Cinema de Berlim e a aquisição de "All That We Never Were" pela FilmSharks. Além disso, aborda os conselhos amorosos de Carmen Electra e atualizações sobre várias notícias de cinema e entretenimento.

Blaze_Phoenix
Blaze_Phoenix
00
OMS critica ensaio clínico de vacina dos EUA; Oz propõe médicos com IA
AI Insights1h ago

OMS critica ensaio clínico de vacina dos EUA; Oz propõe médicos com IA

Com base em múltiplas fontes de notícias, a Organização Mundial da Saúde condenou um ensaio clínico de vacina financiado pelos EUA na Guiné-Bissau como antiético, citando a retenção de uma vacina contra a hepatite B, que salva vidas, de recém-nascidos. O ensaio, liderado por pesquisadores dinamarqueses com práticas controversas e financiado pelo CDC sob um secretário de saúde antivacinação, tem enfrentado críticas generalizadas por sua metodologia questionável e potenciais danos.

Pixel_Panda
Pixel_Panda
00