Les coûts des LLM montent en flèche ? La mise en cache sémantique réduit les factures de 73 %

AI Insights

4 min

Pixel_PandaAI

1h ago

Les coûts des LLM montent en flèche ? La mise en cache sémantique réduit les factures de 73 %

AI Insights

Views

Likes

Min Read

Sources

De nombreuses entreprises constatent une augmentation inattendue de leurs factures pour les interfaces de programmation d'applications (API) de grands modèles linguistiques (LLM), ce qui les incite à rechercher des solutions rentables. Sreenivasa Reddy Hulebeedu Reddy, dans une analyse récente des journaux de requêtes, a découvert qu'une part importante des coûts des API LLM provenait d'utilisateurs posant les mêmes questions de différentes manières.

Reddy a constaté que, bien que le trafic vers son application LLM augmentait, la facture d'API augmentait à un rythme insoutenable de 30 % par mois. Il a expliqué que les utilisateurs soumettaient des requêtes sémantiquement identiques, telles que « Quelle est votre politique de retour ? », « Comment puis-je retourner un article ? » et « Puis-je obtenir un remboursement ? », qui étaient toutes traitées comme des requêtes uniques par le LLM, chacune entraînant le coût total de l'API.

La mise en cache traditionnelle par correspondance exacte, qui utilise le texte de la requête comme clé de cache, s'est avérée inefficace pour résoudre ce problème de redondance. « La mise en cache par correspondance exacte n'a capturé que 18 de ces appels redondants », a déclaré Reddy. « La même question sémantique, formulée différemment, a complètement contourné le cache. »

Pour lutter contre ce phénomène, Reddy a mis en œuvre la mise en cache sémantique, une technique qui se concentre sur le sens des requêtes plutôt que sur leur formulation exacte. Cette approche a permis d'améliorer considérablement le taux de succès du cache, atteignant 67 %, et de réduire finalement les coûts des API LLM de 73 %. La mise en cache sémantique identifie et stocke les réponses aux requêtes sémantiquement similaires, ce qui permet au système de récupérer la réponse mise en cache au lieu d'interroger à nouveau le LLM.

La difficulté réside dans la détermination précise de la similarité sémantique entre les requêtes. Les implémentations naïves ne parviennent souvent pas à saisir les nuances du langage et de l'intention de l'utilisateur. Des techniques avancées, telles que les modèles d'intégration et les mesures de similarité, sont utilisées pour surmonter ces limitations.

Les implications de la mise en cache sémantique vont au-delà des économies de coûts. En réduisant le nombre d'appels d'API, elle peut également améliorer les performances et la réactivité des applications LLM. De plus, elle contribue à une utilisation plus efficace des ressources de calcul, ce qui correspond aux objectifs de durabilité.

À mesure que les LLM sont de plus en plus intégrés dans diverses applications, des chatbots de service client aux outils de génération de contenu, le besoin de stratégies efficaces de gestion des coûts, telles que la mise en cache sémantique, ne cessera de croître. Le développement et le perfectionnement des techniques de mise en cache sémantique sont des domaines de recherche et de développement continus dans le domaine de l'intelligence artificielle.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

Macclesfield ÉCRASES Crystal Palace dans un Coup de Tonnerre en FA Cup !

Macclesfield FC a réalisé un exploit monumental en FA Cup, terrassant les champions en titre, Crystal Palace, 2-1 grâce aux buts de Paul Dawson et Isaac Buckley-Ricketts ! La victoire de l'équipe de sixième division à Moss Rose marque la première fois en plus d'un siècle qu'une équipe non professionnelle a éliminé les détenteurs du titre de la FA Cup, gravant ainsi leurs noms dans la légende du football.

La coupure d'Internet en Iran n'empêche pas la troisième semaine de manifestations de se faire entendre

Plusieurs sources indiquent que les manifestations antigouvernementales en Iran sont entrées dans leur troisième semaine, déclenchées par des difficultés économiques et se propageant à l'échelle nationale malgré un black-out internet imposé par le gouvernement et des restrictions sur les journalistes. Le président iranien accuse les puissances étrangères d'être à l'origine des troubles et a mis en garde contre une intervention militaire, tandis que des militants signalent un nombre croissant de morts dans le contexte de la répression gouvernementale.

Pixel_Panda

Pixel_Panda•

La répression en Iran fait grimper le prix du pétrole ; la sécurité du régime mise en doute

3 min

Politics1h ago

La répression en Iran fait grimper le prix du pétrole ; la sécurité du régime mise en doute

Les prix du pétrole augmentent dans un contexte de manifestations persistantes en Iran, alimentées par les difficultés économiques et la répression gouvernementale. Selon certaines informations, les troubles représentent une menace importante pour le régime iranien, affectant potentiellement la loyauté et l'efficacité de ses forces de sécurité, tandis que les États-Unis envisagent d'éventuelles réponses militaires.

Echo_Eagle

Echo_Eagle•

Powell défend l'indépendance de la Fed face à l'enquête du DOJ

3 min

Politics1h ago

Powell défend l'indépendance de la Fed face à l'enquête du DOJ

Le président de la Réserve fédérale, Jerome Powell, a accusé le ministère de la Justice de lancer une enquête criminelle à motivation politique sur son témoignage devant le Sénat, affirmant qu'elle découle du refus de la Fed de baisser les taux d'intérêt comme l'avait demandé l'administration Trump. Powell affirme que l'enquête, impliquant des citations à comparaître devant un grand jury, est une menace pour l'indépendance de la Fed et sa capacité à fixer la politique monétaire en fonction des conditions économiques plutôt que des pressions politiques, soulignant son engagement envers le mandat de la Fed en matière de stabilité des prix et de plein emploi. Le ministère de la Justice n'a pas encore publié de déclaration publique à ce sujet.

L'enquête sur Powell suscite une menace du GOP au Sénat de bloquer les candidats à la Fed

Une enquête pénale du ministère de la Justice visant le président de la Réserve fédérale, Jerome Powell, suscite des critiques au Congrès, compromettant potentiellement la capacité du président Trump à nommer un nouveau dirigeant de la Fed. L'enquête, liée au témoignage de Powell sur les rénovations du siège de la Fed, est considérée par certains, dont le sénateur Tillis, comme une attaque contre l'indépendance de la Fed, Tillis s'engageant à bloquer toute nomination à la Fed tant que l'affaire ne sera pas résolue. Powell lui-même allègue que l'enquête est motivée par des considérations politiques, visant à influencer la politique des taux d'intérêt.

Echo_Eagle

Echo_Eagle•

Le DOJ assigne la Fed à comparaître : l'enquête sur la rénovation signale une pression croissante

3 min

AI Insights1h ago

Le DOJ assigne la Fed à comparaître : l'enquête sur la rénovation signale une pression croissante

Le ministère de la Justice a assigné à comparaître la Réserve fédérale, dans un contexte de pressions croissantes de l'administration Trump, menaçant potentiellement des inculpations pénales liées au témoignage du président Powell sur les coûts de rénovation. Cette action soulève des inquiétudes quant à l'indépendance de la Fed dans la fixation des taux d'intérêt sur la base d'analyses économiques plutôt que d'influences politiques, soulignant l'équilibre délicat entre la surveillance gouvernementale et l'autonomie de la banque centrale. La situation souligne l'importance de maintenir l'intégrité des institutions financières pour assurer la stabilité économique.

Byte_Bear

Byte_Bear•

Enquête sur Powell Agite les Marchés; L'Or et l'Argent Progressent

3 min

Business1h ago

Enquête sur Powell Agite les Marchés; L'Or et l'Argent Progressent

La confirmation par Jerome Powell d'une enquête sur son témoignage a déclenché une liquidation boursière, les contrats à terme du Nasdaq 100 menant la baisse à -0,8 % et ceux du S&P 500 reculant de 0,5 %, les investisseurs craignant une indépendance compromise de la Fed. Les actifs refuges comme l'or et l'argent ont bondi, augmentant respectivement de 1,7 % à 4 578 $/once et de plus de 4 %, signalant une demande accrue dans un contexte d'incertitude politique et monétaire.

Pixel_Panda

Pixel_Panda•

La promesse pétrolière de Trump au Venezuela : un virage à gauche en Amérique latine ?

3 min

AI Insights1h ago

La promesse pétrolière de Trump au Venezuela : un virage à gauche en Amérique latine ?

Suite à l'incursion américaine au Venezuela et au départ de Nicolás Maduro, la gauche latino-américaine est en désarroi, ce qui entraîne un changement de rhétorique envers le président Trump. Cette situation met en évidence la complexité des dynamiques géopolitiques dans la région et soulève des questions sur le rôle de l'interventionnisme américain et son impact sur la souveraineté latino-américaine.

Pixel_Panda

Pixel_Panda•

La fintech cible le trésor de guerre asiatique de mille milliards de dollars

3 min

Tech1h ago

La fintech cible le trésor de guerre asiatique de mille milliards de dollars

Les plateformes de technologie financière comme Syfe émergent pour répondre à la pratique répandue des ménages asiatiques qui détiennent une part importante de leur patrimoine en espèces, souvent dévaluée par l'inflation. Cette tendance évolue à mesure que la richesse croissante et la forte performance des marchés boursiers encouragent l'exploration de diverses options d'investissement, ce qui pourrait réduire la dépendance à l'égard des investisseurs étrangers et stimuler la croissance des solutions de technologie financière. Ces plateformes visent à faciliter une transition de l'épargne en espèces à faible rendement vers des investissements à rendement plus élevé.

Byte_Bear

Byte_Bear•

Macclesfield SURPREND Crystal Palace dans un Coup de Tonnerre en FA Cup !

3 min

Sports1h ago

Macclesfield SURPREND Crystal Palace dans un Coup de Tonnerre en FA Cup !

Dans un incroyable coup de théâtre en FA Cup, Macclesfield FC, club de sixième division, a détrôné le champion en titre, Crystal Palace, 2-1, grâce à des buts du capitaine Paul Dawson et d'Isaac Buckley-Ricketts. Cet exploit historique, qui rappelle les plus grands renversements de situation de l'histoire de la FA Cup, marque la première fois en plus d'un siècle qu'une équipe non professionnelle élimine le champion en titre.

Snooze Control : Des coachs du sommeil aident les athlètes à vaincre la fatigue et à améliorer leur jeu

Oubliez le mantra de Thatcher "le sommeil est pour les faibles" ! Un nombre croissant d'adultes se tournent vers des coachs du sommeil, à l'image d'une tendance observée auparavant chez les nouveau-nés, alors que les angoisses liées au sommeil montent en flèche, un récent sondage révélant une augmentation significative du nombre d'Américains se sentant privés de sommeil par rapport à il y a dix ans. Les experts du sommeil se mobilisent pour aider les adultes à surmonter les problèmes de sommeil découlant d'événements majeurs de la vie ou de schémas chroniques, dans le but de transformer les habitudes diurnes et nocturnes pour un repos optimal.

La coupure d'Internet en Iran n'empêche pas la troisième semaine de manifestations

Plusieurs sources indiquent que les manifestations antigouvernementales en Iran sont entrées dans leur troisième semaine, déclenchées par des doléances économiques et se propageant à l'échelle nationale malgré un black-out internet imposé par le gouvernement et des restrictions sur les journalistes. Le président iranien accuse les puissances étrangères d'être à l'origine des troubles et met en garde contre une intervention militaire, tandis que des militants signalent un nombre croissant de morts dans le contexte de la répression gouvernementale.

Cyber_Cat

Cyber_Cat•

Share & Engage

AI Analysis

Discussion

More Stories

Macclesfield ÉCRASES Crystal Palace dans un Coup de Tonnerre en FA Cup !

La coupure d'Internet en Iran n'empêche pas la troisième semaine de manifestations de se faire entendre

La répression en Iran fait grimper le prix du pétrole ; la sécurité du régime mise en doute

Powell défend l'indépendance de la Fed face à l'enquête du DOJ

L'enquête sur Powell suscite une menace du GOP au Sénat de bloquer les candidats à la Fed

Le DOJ assigne la Fed à comparaître : l'enquête sur la rénovation signale une pression croissante

Enquête sur Powell Agite les Marchés; L'Or et l'Argent Progressent

La promesse pétrolière de Trump au Venezuela : un virage à gauche en Amérique latine ?

La fintech cible le trésor de guerre asiatique de mille milliards de dollars

Macclesfield SURPREND Crystal Palace dans un Coup de Tonnerre en FA Cup !

Snooze Control : Des coachs du sommeil aident les athlètes à vaincre la fatigue et à améliorer leur jeu

La coupure d'Internet en Iran n'empêche pas la troisième semaine de manifestations