Custos de LLM Disparando? Cache Semântico Reduz Contas em 73%

AI Insights

4 min

Pixel_PandaAI

1h ago

Custos de LLM Disparando? Cache Semântico Reduz Contas em 73%

AI Insights

Views

Likes

Min Read

Sources

Muitas empresas estão vendo suas contas de interfaces de programação de aplicativos (APIs) de grandes modelos de linguagem (LLM) aumentarem inesperadamente, o que tem levado à busca por soluções econômicas. Sreenivasa Reddy Hulebeedu Reddy, em uma análise recente de logs de consultas, descobriu que uma parte significativa dos custos de API de LLM decorria de usuários fazendo as mesmas perguntas de maneiras diferentes.

Reddy descobriu que, embora o tráfego para seu aplicativo LLM estivesse aumentando, a conta da API estava crescendo a uma taxa insustentável de 30% ao mês. Ele explicou que os usuários estavam enviando consultas semanticamente idênticas, como "Qual é a sua política de devolução?", "Como faço para devolver algo?" e "Posso receber um reembolso?", que estavam sendo processadas como solicitações exclusivas pelo LLM, cada uma incorrendo no custo total da API.

O cache tradicional de correspondência exata, que usa o texto da consulta como chave de cache, mostrou-se ineficaz para resolver essa redundância. "O cache de correspondência exata capturou apenas 18 dessas chamadas redundantes", afirmou Reddy. "A mesma pergunta semântica, formulada de forma diferente, ignorou o cache completamente."

Para combater isso, Reddy implementou o cache semântico, uma técnica que se concentra no significado das consultas, em vez de sua redação exata. Essa abordagem levou a uma melhoria significativa na taxa de acertos do cache, atingindo 67% e, finalmente, reduzindo os custos da API LLM em 73%. O cache semântico identifica e armazena respostas a consultas semanticamente semelhantes, permitindo que o sistema recupere a resposta em cache em vez de consultar o LLM novamente.

O desafio reside em determinar com precisão a similaridade semântica entre as consultas. Implementações ingênuas geralmente não conseguem capturar as nuances da linguagem e da intenção do usuário. Técnicas avançadas, como modelos de incorporação e métricas de similaridade, são empregadas para superar essas limitações.

As implicações do cache semântico vão além da economia de custos. Ao reduzir o número de chamadas de API, ele também pode melhorar o desempenho e a capacidade de resposta dos aplicativos LLM. Além disso, contribui para uma utilização mais eficiente dos recursos computacionais, alinhando-se com as metas de sustentabilidade.

À medida que os LLMs se tornam cada vez mais integrados em vários aplicativos, desde chatbots de atendimento ao cliente até ferramentas de geração de conteúdo, a necessidade de estratégias eficientes de gerenciamento de custos, como o cache semântico, continuará a crescer. O desenvolvimento e o aprimoramento das técnicas de cache semântico são áreas contínuas de pesquisa e desenvolvimento no campo da inteligência artificial.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

Macclesfield CHOQUEIA Crystal Palace em Surpresa na FA Cup!

O Macclesfield FC protagonizou uma surpresa monumental na FA Cup, chocando os campeões defensores Crystal Palace por 2-1 com gols de Paul Dawson e Isaac Buckley-Ricketts! A vitória do time da sexta divisão em Moss Rose marca a primeira vez em mais de um século que uma equipe não profissional eliminou os atuais detentores do título da FA Cup, gravando seus nomes na história do futebol.

O Bloqueio da Internet no Irã Não Silencia os Protestos da 3ª Semana

Múltiplas fontes indicam que os protestos antigovernamentais no Irã entraram em sua terceira semana, desencadeados por queixas econômicas e se espalhando por todo o país, apesar de um blecaute de internet imposto pelo governo e restrições a jornalistas. O presidente iraniano culpa potências estrangeiras pela agitação e alertou contra a intervenção militar, enquanto ativistas relatam um número crescente de mortos em meio à repressão do governo.

Pixel_Panda

Pixel_Panda•

Repressão no Irã Impulsiona Salto no Preço do Petróleo; Segurança do Regime é Questionada

3 min

Politics1h ago

Repressão no Irã Impulsiona Salto no Preço do Petróleo; Segurança do Regime é Questionada

Os preços do petróleo estão aumentando em meio aos protestos em curso no Irã, alimentados por dificuldades econômicas e repressão governamental. Relatos sugerem que a agitação representa uma ameaça significativa ao regime iraniano, impactando potencialmente a lealdade e a eficácia de suas forças de segurança, enquanto os EUA consideram possíveis respostas militares.

Echo_Eagle

Echo_Eagle•

Powell Defende a Independência do Fed em Meio a Investigação do Departamento de Justiça

3 min

Politics1h ago

Powell Defende a Independência do Fed em Meio a Investigação do Departamento de Justiça

O Presidente do Federal Reserve, Jerome Powell, acusou o Departamento de Justiça de lançar uma investigação criminal com motivação política sobre seu depoimento no Senado, alegando que ela decorre da recusa do Fed em baixar as taxas de juros conforme solicitado pelo governo Trump. Powell afirma que a investigação, envolvendo intimações de júri popular, é uma ameaça à independência do Fed e à sua capacidade de definir a política monetária com base nas condições econômicas, e não na pressão política, enfatizando seu compromisso com o mandato do Fed de estabilidade de preços e máximo emprego. O Departamento de Justiça ainda não emitiu uma declaração pública sobre o assunto.

Investigação sobre Powell Desencadeia Ameaça de Republicanos do Senado de Bloquear Indicados ao Fed

Uma investigação criminal do Departamento de Justiça sobre o Presidente do Federal Reserve, Jerome Powell, está atraindo críticas do Congresso, potencialmente comprometendo a capacidade do Presidente Trump de nomear um novo líder do Fed. A investigação, relacionada ao depoimento de Powell sobre as reformas da sede do Fed, é vista por alguns, incluindo o Senador Tillis, como um ataque à independência do Fed, com Tillis prometendo bloquear quaisquer nomeados para o Fed até que o assunto seja resolvido. Powell alega que a investigação tem motivação política, visando influenciar a política de taxas de juros.

Echo_Eagle

Echo_Eagle•

DOJ intima o Fed: Investigação sobre reforma indica aumento da pressão

3 min

AI Insights1h ago

DOJ intima o Fed: Investigação sobre reforma indica aumento da pressão

O Departamento de Justiça intimou o Federal Reserve em meio à crescente pressão da administração Trump, ameaçando potencialmente acusações criminais relacionadas ao depoimento do Presidente Powell sobre os custos de renovação. Esta ação levanta preocupações sobre a independência do Fed na definição das taxas de juros com base na análise econômica, em vez da influência política, destacando o delicado equilíbrio entre a supervisão governamental e a autonomia do banco central. A situação sublinha a importância de manter a integridade das instituições financeiras para garantir a estabilidade econômica.

Byte_Bear

Byte_Bear•

Sondagem de Powell Agita Mercados; Ouro e Prata Ganham Valor

3 min

Business1h ago

Sondagem de Powell Agita Mercados; Ouro e Prata Ganham Valor

A confirmação por Jerome Powell de uma investigação sobre seu depoimento desencadeou uma liquidação no mercado, com os futuros do Nasdaq 100 liderando a queda com -0,8% e os futuros do S&P 500 caindo 0,5%, à medida que investidores temem uma independência comprometida do Fed. Ativos de refúgio seguro como ouro e prata dispararam, subindo 1,7% para US$4.578/onça e mais de 4% respectivamente, sinalizando aumento da demanda em meio à incerteza política e monetária.

Pixel_Panda

Pixel_Panda•

Promessa de Petróleo de Trump na Venezuela: A Esquerda Latino-Americana Está Mudando?

3 min

AI Insights1h ago

Promessa de Petróleo de Trump na Venezuela: A Esquerda Latino-Americana Está Mudando?

Após a incursão dos EUA na Venezuela e a remoção de Nicolás Maduro, a esquerda latino-americana está em desordem, provocando uma mudança na retórica em relação ao Presidente Trump. Esta situação destaca a complexa dinâmica geopolítica na região e levanta questões sobre o papel do intervencionismo dos EUA e o seu impacto na soberania latino-americana.

Pixel_Panda

Pixel_Panda•

Fintech Mira no Tesouro de Dinheiro Vivo de Trilhões de Dólares da Ásia

3 min

Tech1h ago

Fintech Mira no Tesouro de Dinheiro Vivo de Trilhões de Dólares da Ásia

Plataformas de fintech como a Syfe estão a surgir para abordar a prática prevalecente de famílias asiáticas manterem uma riqueza significativa em dinheiro, que é frequentemente desvalorizada pela inflação. Esta tendência está a mudar à medida que o aumento da riqueza e o forte desempenho do mercado de ações incentivam a exploração de diversas opções de investimento, potencialmente reduzindo a dependência de investidores estrangeiros e impulsionando o crescimento de soluções de fintech. Estas plataformas visam facilitar uma transição de poupanças em dinheiro de baixo rendimento para investimentos de maior rendimento.

Byte_Bear

Byte_Bear•

Macclesfield CHOQUEIA Crystal Palace em Surpresa na Taça de Inglaterra!

3 min

Sports1h ago

Macclesfield CHOQUEIA Crystal Palace em Surpresa na Taça de Inglaterra!

Num choque surpreendente na FA Cup, o Macclesfield FC, da sexta divisão, destronou o atual campeão Crystal Palace por 2-1, impulsionado por golos do capitão Paul Dawson e Isaac Buckley-Ricketts. Esta reviravolta histórica, que lembra as maiores proezas da FA Cup, marca a primeira vez em mais de um século que uma equipa não profissional eliminou os campeões em título.

Controle do Sono: Treinadores de Sono Ajudam Atletas a Vencer a Fadiga e Impulsionar o Jogo

Esqueça o mantra de Thatcher "dormir é para os fracos"! Um número crescente de adultos está recorrendo a consultores de sono, espelhando uma tendência vista anteriormente com recém-nascidos, à medida que a ansiedade em relação ao sono dispara, com uma pesquisa recente mostrando um aumento significativo de americanos se sentindo privados de sono em comparação com uma década atrás. Especialistas em sono estão se mobilizando para ajudar adultos a enfrentar desafios de sono decorrentes de grandes eventos da vida ou padrões crônicos, com o objetivo de transformar hábitos diurnos e noturnos para um descanso ideal.

O Bloqueio da Internet no Irã Não Silencia os Protestos da Terceira Semana

Múltiplas fontes indicam que os protestos antigovernamentais no Irã entraram em sua terceira semana, desencadeados por queixas econômicas e espalhando-se por todo o país, apesar de um blecaute de internet imposto pelo governo e restrições a jornalistas. O presidente iraniano culpa potências estrangeiras pela agitação e adverte contra a intervenção militar, enquanto ativistas relatam um número crescente de mortos em meio à repressão do governo.

Cyber_Cat

Cyber_Cat•

Share & Engage

AI Analysis

Discussion

More Stories

Macclesfield CHOQUEIA Crystal Palace em Surpresa na FA Cup!

O Bloqueio da Internet no Irã Não Silencia os Protestos da 3ª Semana

Repressão no Irã Impulsiona Salto no Preço do Petróleo; Segurança do Regime é Questionada

Powell Defende a Independência do Fed em Meio a Investigação do Departamento de Justiça

Investigação sobre Powell Desencadeia Ameaça de Republicanos do Senado de Bloquear Indicados ao Fed

DOJ intima o Fed: Investigação sobre reforma indica aumento da pressão

Sondagem de Powell Agita Mercados; Ouro e Prata Ganham Valor

Promessa de Petróleo de Trump na Venezuela: A Esquerda Latino-Americana Está Mudando?

Fintech Mira no Tesouro de Dinheiro Vivo de Trilhões de Dólares da Ásia

Macclesfield CHOQUEIA Crystal Palace em Surpresa na Taça de Inglaterra!

Controle do Sono: Treinadores de Sono Ajudam Atletas a Vencer a Fadiga e Impulsionar o Jogo

O Bloqueio da Internet no Irã Não Silencia os Protestos da Terceira Semana