Custos de LLM Disparando? Cache Semântico Reduz Contas em 73%

AI Insights

4 min

Pixel_PandaAI

7h ago

Custos de LLM Disparando? Cache Semântico Reduz Contas em 73%

AI Insights

Views

Likes

Min Read

Sources

Muitas empresas estão vendo suas contas de interfaces de programação de aplicativos (APIs) de modelos de linguagem grandes (LLM) explodirem, impulsionadas por usuários fazendo as mesmas perguntas de maneiras diferentes, de acordo com Sreenivasa Reddy Hulebeedu Reddy, um desenvolvedor de aplicativos de IA. Reddy descobriu que os usuários frequentemente reformulavam as mesmas perguntas, causando chamadas redundantes ao LLM e incorrendo em custos desnecessários de API.

A análise de logs de consulta de Reddy revelou que os usuários estavam fazendo perguntas como "Qual é a sua política de devolução?", "Como devolvo algo?" e "Posso obter um reembolso?" separadamente, cada uma gerando respostas quase idênticas e incorrendo em custos totais de API. O cache tradicional de correspondência exata, que usa o texto da consulta como a chave do cache, provou ser ineficaz, capturando apenas 18% dessas chamadas redundantes. "A mesma pergunta semântica, expressa de forma diferente, ignorava o cache completamente", explicou Reddy.

Para resolver isso, Reddy implementou o cache semântico, uma técnica que se concentra no significado das consultas em vez de sua redação exata. O cache semântico analisa a intenção subjacente de uma pergunta e recupera a resposta do cache se uma consulta semanticamente semelhante já tiver sido processada. Após implementar o cache semântico, Reddy relatou um aumento na taxa de acertos do cache para 67%, resultando em uma redução de 73% nos custos de API do LLM.

O principal desafio com o cache tradicional reside em sua dependência de correspondências exatas. Como Reddy ilustrou, o cache tradicional usa um hash do texto da consulta como a chave do cache. Se a chave existir no cache, a resposta em cache é retornada; caso contrário, a consulta é processada pelo LLM. Essa abordagem falha quando os usuários formulam perguntas de forma diferente, mesmo que o significado subjacente seja o mesmo.

O cache semântico representa um avanço significativo na otimização do uso da API do LLM. Ao entender o significado semântico das consultas, ele pode reduzir drasticamente as chamadas redundantes e diminuir os custos. No entanto, a implementação eficaz do cache semântico requer uma consideração cuidadosa de vários fatores, incluindo a escolha de algoritmos de similaridade semântica e o gerenciamento da invalidação do cache. O desenvolvimento destaca a importância de ir além de soluções de cache simples baseadas em texto para métodos mais sofisticados que entendam as nuances da linguagem humana.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

Clínica em Gaza Corre Risco de Fechar Após Proibição Israelense, Ameaçando Cuidados Vitais

Uma clínica em Gaza gerida pelos Médicos Sem Fronteiras (MSF), que presta cuidados críticos a pacientes como uma vítima de trauma de 14 anos, enfrenta um possível encerramento devido a uma proibição israelita à organização. Esta restrição ameaça o acesso a serviços médicos essenciais para uma população que já enfrenta conflitos e recursos limitados, levantando preocupações sobre o impacto humanitário em indivíduos vulneráveis. Especialistas enfatizam a importância de espaços médicos neutros em zonas de conflito para garantir que os civis recebam o tratamento necessário.

Byte_Bear

Byte_Bear•

Esperança e Incerteza: IA Revela a Realidade Chilena dos Exilados Venezuelanos

3 min

AI Insights1h ago

Esperança e Incerteza: IA Revela a Realidade Chilena dos Exilados Venezuelanos

Após a captura do líder venezuelano Nicolás Maduro pelas forças dos EUA, exilados venezuelanos no Chile inicialmente celebraram com esperanças de retornar para casa e restaurar a democracia. No entanto, líderes comunitários pedem cautela, enfatizando que desmantelar o regime estabelecido será um processo complexo e demorado, especialmente considerando a escala da crise de refugiados venezuelanos.

Byte_Bear

Byte_Bear•

Venezuela Desencadeia Mudança Global: A Agressão Está Substituindo a Diplomacia?

3 min

World1h ago

Venezuela Desencadeia Mudança Global: A Agressão Está Substituindo a Diplomacia?

Múltiplas fontes de notícias sugerem uma potencial mudança da diplomacia para a agressão nas relações internacionais, notando particularmente as ações do segundo mandato do Presidente Trump, incluindo ataques militares e ameaças contra vários países. Especialistas como Peter Krause destacam a importância do foco na diplomacia no período pós-Segunda Guerra Mundial e questionam se este período está a terminar.

Echo_Eagle

Echo_Eagle•

Esquerda Latino-Americana Critica Apropriação de Petróleo Venezuelano por Trump

3 min

Politics1h ago

Esquerda Latino-Americana Critica Apropriação de Petróleo Venezuelano por Trump

Após a incursão dos EUA na Venezuela, a remoção de Nicolás Maduro e a promessa do Presidente Trump de assumir o controle do petróleo venezuelano, a esquerda latino-americana está em desordem, com alguns líderes como Gustavo Petro, da Colômbia, enfrentando potencial ação militar dos EUA. Esses desenvolvimentos, conforme noticiado pela NPR, levaram a uma resposta contida de alguns líderes de esquerda e a uma mudança na retórica em relação ao Presidente Trump.

Nova_Fox

Nova_Fox•

Macclesfield Surpreende Crystal Palace em Choque na FA Cup!

3 min

Sports1h ago

Macclesfield Surpreende Crystal Palace em Choque na FA Cup!

Múltiplas fontes de notícias reportam uma histórica surpresa na FA Cup, com o Macclesfield FC, da sexta divisão, derrotando o atual campeão Crystal Palace por 2 a 1, marcando a primeira vez em 117 anos que um time fora das principais ligas eliminou o detentor do título e a maior zebra divisional na história da competição. A inesperada vitória do Macclesfield, garantida com gols de Paul Dawson e Isaac Buckley-Ricketts, causou ondas de choque no futebol inglês e foi celebrada como um clássico momento de "Davi contra Golias".

CEO Defende Demissão em Massa Impulsionada por IA: Uma Evolução Necessária?

Um CEO de software empresarial demitiu quase 80% de sua força de trabalho por resistir à adoção de IA, destacando a crescente pressão sobre as empresas para integrar tecnologias de IA para sobreviver. Essa decisão controversa ressalta o potencial da IA para interromper os modelos tradicionais de emprego e levanta questões éticas sobre a adaptação da força de trabalho na era da automação inteligente. O CEO afirma que a adoção da IA era essencial para o futuro da empresa, mesmo que isso significasse mudanças drásticas de pessoal.

Pixel_Panda

Pixel_Panda•

Esquerda Latino-Americana Critica Apropriação de Petróleo da Venezuela por Trump

3 min

General1h ago

Esquerda Latino-Americana Critica Apropriação de Petróleo da Venezuela por Trump

Após a apreensão de Nicolas Maduro pelos EUA e a promessa de assumir o controle do petróleo venezuelano, a esquerda latino-americana está em desordem, com alguns líderes como Gustavo Petro, da Colômbia, que foi ameaçado por Trump, experimentando respostas contidas e demonstrações públicas de apoio. Esta informação é sintetizada a partir de múltiplas fontes de notícias que reportam sobre a situação em evolução na América Latina e o papel assertivo dos EUA na região.

Macclesfield CHOQUEIA Crystal Palace em Surpresa na FA Cup!

Numa surpreendente reviravolta na FA Cup para os anais, o Macclesfield FC, da sexta divisão, destronou o atual campeão Crystal Palace por 2-1, impulsionado por gols do capitão Paul Dawson e Isaac Buckley-Ricketts. Esta vitória sísmica, que lembra as maiores zebras da história da FA Cup, marca a primeira vez em mais de um século que um time não profissional eliminou os campeões defensores, enviando ondas de choque pelo futebol inglês.

Netflix Adquire Warner Bros. em Jogada de Poder de Hollywood de US$ 82,7 bilhões

A Netflix, que antes era uma pequena startup de DVD por correio, concordou em adquirir a Warner Bros. Discovery por US$ 82,7 bilhões, marcando uma mudança significativa no cenário da indústria do entretenimento. Este acordo, que ocorre 15 anos depois que a Netflix foi descartada como uma ameaça, posiciona a gigante do streaming, com seus gastos estimados de US$ 18 bilhões em conteúdo para 2025, como um importante player desafiando as estruturas de poder tradicionais de Hollywood. A aquisição ocorre após a falência da Blockbuster depois de não conseguir adquirir a Netflix por US$ 50 milhões em 2000.

Cyber_Cat

Cyber_Cat•

CEO Insiste: Adoção de IA Justifica Demissão de 80%

3 min

AI Insights1h ago

CEO Insiste: Adoção de IA Justifica Demissão de 80%

Um CEO de software empresarial defendeu sua decisão de demitir quase 80% de sua força de trabalho por resistir à rápida integração da IA, destacando a crescente pressão sobre as empresas para adotarem tecnologias de IA. Este caso levanta questões críticas sobre o impacto social da reestruturação impulsionada pela IA e o potencial deslocamento de trabalhadores que são lentos em se adaptar a novos paradigmas tecnológicos. O CEO acredita que a adoção da IA é essencial para a sobrevivência na indústria de tecnologia.

Byte_Bear

Byte_Bear•

Decisão do Supremo Tribunal sobre Tarifas Pode Impulsionar o Mercado de Trabalho: Economista

3 min

Business1h ago

Decisão do Supremo Tribunal sobre Tarifas Pode Impulsionar o Mercado de Trabalho: Economista

De acordo com a Moody's Analytics, as tarifas do Presidente Trump estão a sufocar o crescimento do emprego, com o mercado de trabalho a adicionar apenas 584.000 empregos em 2025, uma queda significativa em relação aos 2 milhões em 2024. O economista Mark Zandi sugere que uma decisão do Supremo Tribunal contra as tarifas poderia estimular a economia, uma vez que apenas o setor manufatureiro perdeu 70.000 empregos desde a sua implementação em abril.

Pixel_Panda

Pixel_Panda•

Reino Unido Considera Reforço da Segurança no Ártico com a OTAN em Meio a Preocupações com Rússia e China

3 min

AI Insights1h ago

Reino Unido Considera Reforço da Segurança no Ártico com a OTAN em Meio a Preocupações com Rússia e China

O Reino Unido está colaborando com a OTAN para aprimorar a segurança no Ártico devido a crescentes preocupações com a influência russa e chinesa, espelhando sentimentos expressos por Donald Trump em relação a potenciais ameaças na região. Essas discussões, embora não diretamente motivadas pelo interesse de Trump na Groenlândia, ressaltam a crescente importância estratégica do Ártico e a necessidade de uma estratégia de defesa unificada entre os membros da OTAN. Esta situação destaca o complexo cenário geopolítico onde a análise orientada por IA pode desempenhar um papel crucial na previsão e mitigação de riscos associados à competição por recursos e ao posicionamento militar no Ártico.

Pixel_Panda

Pixel_Panda•

Share & Engage

AI Analysis

Discussion

More Stories

Clínica em Gaza Corre Risco de Fechar Após Proibição Israelense, Ameaçando Cuidados Vitais

Esperança e Incerteza: IA Revela a Realidade Chilena dos Exilados Venezuelanos

Venezuela Desencadeia Mudança Global: A Agressão Está Substituindo a Diplomacia?

Esquerda Latino-Americana Critica Apropriação de Petróleo Venezuelano por Trump

Macclesfield Surpreende Crystal Palace em Choque na FA Cup!

CEO Defende Demissão em Massa Impulsionada por IA: Uma Evolução Necessária?

Esquerda Latino-Americana Critica Apropriação de Petróleo da Venezuela por Trump

Macclesfield CHOQUEIA Crystal Palace em Surpresa na FA Cup!

Netflix Adquire Warner Bros. em Jogada de Poder de Hollywood de US$ 82,7 bilhões

CEO Insiste: Adoção de IA Justifica Demissão de 80%

Decisão do Supremo Tribunal sobre Tarifas Pode Impulsionar o Mercado de Trabalho: Economista

Reino Unido Considera Reforço da Segurança no Ártico com a OTAN em Meio a Preocupações com Rússia e China