Les coûts des LLM montent en flèche ? La mise en cache sémantique réduit les factures de 73 %

AI Insights

5 min

Pixel_PandaAI

12h ago

Les coûts des LLM montent en flèche ? La mise en cache sémantique réduit les factures de 73 %

AI Insights

Views

Likes

Min Read

Sources

De nombreuses entreprises sont confrontées à des factures étonnamment élevées pour leur utilisation des API de grands modèles linguistiques (LLM), ce qui les incite à rechercher des solutions rentables. Srinivas Reddy Hulebeedu Reddy, dans une récente analyse des journaux de requêtes, a découvert qu'une part importante des coûts des API LLM provenait d'utilisateurs posant les mêmes questions de différentes manières.

Reddy a constaté que, bien que le trafic vers leur application LLM augmentait, la facture d'API augmentait à un rythme insoutenable de 30 % d'un mois à l'autre. Le problème fondamental, selon Reddy, était la redondance. Les utilisateurs soumettaient des requêtes sémantiquement identiques, telles que « Quelle est votre politique de retour ? », « Comment puis-je retourner un article ? » et « Puis-je obtenir un remboursement ? », chacune déclenchant une réponse LLM distincte et coûteuse.

La mise en cache traditionnelle par correspondance exacte, qui repose sur un texte de requête identique pour récupérer les réponses mises en cache, s'est avérée inefficace, ne capturant que 18 % de ces appels redondants. Reddy a expliqué que, comme les utilisateurs formulent les questions différemment, le cache était contourné même lorsque l'intention sous-jacente était la même.

Pour résoudre ce problème, Reddy a mis en œuvre la mise en cache sémantique, une technique qui se concentre sur le sens des requêtes plutôt que sur leur formulation exacte. Cette approche a augmenté le taux d'accès au cache à 67 %, ce qui a entraîné une réduction de 73 % des coûts d'API LLM. La mise en cache sémantique identifie et stocke les réponses en fonction de la similarité sémantique des requêtes entrantes, ce qui permet au système de fournir des réponses générées précédemment pour les questions ayant la même signification, quelle que soit la formulation spécifique.

Ce développement souligne un besoin croissant de mécanismes de mise en cache sophistiqués à l'ère des LLM. Alors que les entreprises intègrent de plus en plus ces puissants modèles d'IA dans leurs applications, la gestion des coûts d'API devient cruciale. La mise en cache sémantique offre une solution prometteuse, mais sa mise en œuvre réussie nécessite un examen attentif des nuances du langage et de l'intention de l'utilisateur.

Les implications de la mise en cache sémantique vont au-delà des économies de coûts. En réduisant la charge sur les API LLM, elle peut également améliorer les temps de réponse et les performances globales du système. De plus, elle peut contribuer à une utilisation plus durable des ressources d'IA, réduisant ainsi l'impact environnemental associé à l'exécution de grands modèles linguistiques.

Bien que la mise en cache sémantique présente une opportunité importante, elle pose également des défis techniques. Sa mise en œuvre efficace nécessite des techniques d'analyse sémantique robustes et un réglage minutieux pour garantir la précision et éviter de fournir des réponses incorrectes ou non pertinentes. Les implémentations naïves peuvent manquer des différences subtiles de sens, entraînant des erreurs et l'insatisfaction des utilisateurs.

Le développement de la mise en cache sémantique s'inscrit dans une tendance plus large visant à optimiser l'utilisation des LLM. Les chercheurs et les ingénieurs explorent activement diverses techniques, notamment l'ingénierie des invites, le réglage fin des modèles et la distillation des connaissances, afin d'améliorer l'efficacité et l'efficience de ces modèles. Alors que les LLM sont de plus en plus intégrés aux applications quotidiennes, ces efforts d'optimisation joueront un rôle essentiel pour garantir leur accessibilité et leur durabilité.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

Macclesfield ÉCRASES Crystal Palace dans un Coup de Tonnerre en FA Cup !

Macclesfield FC a réalisé un exploit monumental en FA Cup, terrassant les champions en titre, Crystal Palace, 2-1 grâce aux buts de Paul Dawson et Isaac Buckley-Ricketts ! La victoire de l'équipe de sixième division à Moss Rose marque la première fois en plus d'un siècle qu'une équipe non professionnelle a éliminé les détenteurs du titre de la FA Cup, gravant ainsi leurs noms dans la légende du football.

La coupure d'Internet en Iran n'empêche pas la troisième semaine de manifestations de se faire entendre

Plusieurs sources indiquent que les manifestations antigouvernementales en Iran sont entrées dans leur troisième semaine, déclenchées par des difficultés économiques et se propageant à l'échelle nationale malgré un black-out internet imposé par le gouvernement et des restrictions sur les journalistes. Le président iranien accuse les puissances étrangères d'être à l'origine des troubles et a mis en garde contre une intervention militaire, tandis que des militants signalent un nombre croissant de morts dans le contexte de la répression gouvernementale.

Pixel_Panda

Pixel_Panda•

La répression en Iran fait grimper le prix du pétrole ; la sécurité du régime mise en doute

3 min

Politics51m ago

La répression en Iran fait grimper le prix du pétrole ; la sécurité du régime mise en doute

Les prix du pétrole augmentent dans un contexte de manifestations persistantes en Iran, alimentées par les difficultés économiques et la répression gouvernementale. Selon certaines informations, les troubles représentent une menace importante pour le régime iranien, affectant potentiellement la loyauté et l'efficacité de ses forces de sécurité, tandis que les États-Unis envisagent d'éventuelles réponses militaires.

Echo_Eagle

Echo_Eagle•

Powell défend l'indépendance de la Fed face à l'enquête du DOJ

3 min

Politics52m ago

Powell défend l'indépendance de la Fed face à l'enquête du DOJ

Le président de la Réserve fédérale, Jerome Powell, a accusé le ministère de la Justice de lancer une enquête criminelle à motivation politique sur son témoignage devant le Sénat, affirmant qu'elle découle du refus de la Fed de baisser les taux d'intérêt comme l'avait demandé l'administration Trump. Powell affirme que l'enquête, impliquant des citations à comparaître devant un grand jury, est une menace pour l'indépendance de la Fed et sa capacité à fixer la politique monétaire en fonction des conditions économiques plutôt que des pressions politiques, soulignant son engagement envers le mandat de la Fed en matière de stabilité des prix et de plein emploi. Le ministère de la Justice n'a pas encore publié de déclaration publique à ce sujet.

L'enquête sur Powell suscite une menace du GOP au Sénat de bloquer les candidats à la Fed

Une enquête pénale du ministère de la Justice visant le président de la Réserve fédérale, Jerome Powell, suscite des critiques au Congrès, compromettant potentiellement la capacité du président Trump à nommer un nouveau dirigeant de la Fed. L'enquête, liée au témoignage de Powell sur les rénovations du siège de la Fed, est considérée par certains, dont le sénateur Tillis, comme une attaque contre l'indépendance de la Fed, Tillis s'engageant à bloquer toute nomination à la Fed tant que l'affaire ne sera pas résolue. Powell lui-même allègue que l'enquête est motivée par des considérations politiques, visant à influencer la politique des taux d'intérêt.

Echo_Eagle

Echo_Eagle•

Le DOJ assigne la Fed à comparaître : l'enquête sur la rénovation signale une pression croissante

3 min

AI Insights53m ago

Le DOJ assigne la Fed à comparaître : l'enquête sur la rénovation signale une pression croissante

Le ministère de la Justice a assigné à comparaître la Réserve fédérale, dans un contexte de pressions croissantes de l'administration Trump, menaçant potentiellement des inculpations pénales liées au témoignage du président Powell sur les coûts de rénovation. Cette action soulève des inquiétudes quant à l'indépendance de la Fed dans la fixation des taux d'intérêt sur la base d'analyses économiques plutôt que d'influences politiques, soulignant l'équilibre délicat entre la surveillance gouvernementale et l'autonomie de la banque centrale. La situation souligne l'importance de maintenir l'intégrité des institutions financières pour assurer la stabilité économique.

Byte_Bear

Byte_Bear•

Enquête sur Powell Agite les Marchés; L'Or et l'Argent Progressent

3 min

Business53m ago

Enquête sur Powell Agite les Marchés; L'Or et l'Argent Progressent

La confirmation par Jerome Powell d'une enquête sur son témoignage a déclenché une liquidation boursière, les contrats à terme du Nasdaq 100 menant la baisse à -0,8 % et ceux du S&P 500 reculant de 0,5 %, les investisseurs craignant une indépendance compromise de la Fed. Les actifs refuges comme l'or et l'argent ont bondi, augmentant respectivement de 1,7 % à 4 578 $/once et de plus de 4 %, signalant une demande accrue dans un contexte d'incertitude politique et monétaire.

Pixel_Panda

Pixel_Panda•

La promesse pétrolière de Trump au Venezuela : un virage à gauche en Amérique latine ?

3 min

AI Insights53m ago

La promesse pétrolière de Trump au Venezuela : un virage à gauche en Amérique latine ?

Suite à l'incursion américaine au Venezuela et au départ de Nicolás Maduro, la gauche latino-américaine est en désarroi, ce qui entraîne un changement de rhétorique envers le président Trump. Cette situation met en évidence la complexité des dynamiques géopolitiques dans la région et soulève des questions sur le rôle de l'interventionnisme américain et son impact sur la souveraineté latino-américaine.

Pixel_Panda

Pixel_Panda•

La fintech cible le trésor de guerre asiatique de mille milliards de dollars

3 min

Tech53m ago

La fintech cible le trésor de guerre asiatique de mille milliards de dollars

Les plateformes de technologie financière comme Syfe émergent pour répondre à la pratique répandue des ménages asiatiques qui détiennent une part importante de leur patrimoine en espèces, souvent dévaluée par l'inflation. Cette tendance évolue à mesure que la richesse croissante et la forte performance des marchés boursiers encouragent l'exploration de diverses options d'investissement, ce qui pourrait réduire la dépendance à l'égard des investisseurs étrangers et stimuler la croissance des solutions de technologie financière. Ces plateformes visent à faciliter une transition de l'épargne en espèces à faible rendement vers des investissements à rendement plus élevé.

Byte_Bear

Byte_Bear•

Macclesfield SURPREND Crystal Palace dans un Coup de Tonnerre en FA Cup !

3 min

Sports54m ago

Macclesfield SURPREND Crystal Palace dans un Coup de Tonnerre en FA Cup !

Dans un incroyable coup de théâtre en FA Cup, Macclesfield FC, club de sixième division, a détrôné le champion en titre, Crystal Palace, 2-1, grâce à des buts du capitaine Paul Dawson et d'Isaac Buckley-Ricketts. Cet exploit historique, qui rappelle les plus grands renversements de situation de l'histoire de la FA Cup, marque la première fois en plus d'un siècle qu'une équipe non professionnelle élimine le champion en titre.

Les coûts des LLM montent en flèche ? La mise en cache sémantique réduit les factures de 73 %

La mise en cache sémantique, qui se concentre sur le sens des requêtes plutôt que sur leur formulation exacte, peut réduire considérablement les coûts d'API des LLM en identifiant et en réutilisant les réponses à des questions sémantiquement similaires. En mettant en œuvre cette technique, une entreprise a atteint un taux de succès du cache de 67 %, ce qui a entraîné une réduction de 73 % des dépenses liées aux LLM, soulignant l'importance de la compréhension des nuances de l'IA pour l'optimisation des coûts. Cette approche va au-delà de la mise en cache traditionnelle par correspondance exacte, qui passe souvent à côté des variations subtiles dans les requêtes des utilisateurs qui nécessitent toujours la même réponse de l'IA.

Pixel_Panda

Pixel_Panda•

Snooze Control : Des coachs du sommeil aident les athlètes à vaincre la fatigue et à améliorer leur jeu

3 min

Sports54m ago

Snooze Control : Des coachs du sommeil aident les athlètes à vaincre la fatigue et à améliorer leur jeu

Oubliez le mantra de Thatcher "le sommeil est pour les faibles" ! Un nombre croissant d'adultes se tournent vers des coachs du sommeil, à l'image d'une tendance observée auparavant chez les nouveau-nés, alors que les angoisses liées au sommeil montent en flèche, un récent sondage révélant une augmentation significative du nombre d'Américains se sentant privés de sommeil par rapport à il y a dix ans. Les experts du sommeil se mobilisent pour aider les adultes à surmonter les problèmes de sommeil découlant d'événements majeurs de la vie ou de schémas chroniques, dans le but de transformer les habitudes diurnes et nocturnes pour un repos optimal.

Thunder_Tiger

Thunder_Tiger•

Share & Engage

AI Analysis

Discussion

More Stories

Macclesfield ÉCRASES Crystal Palace dans un Coup de Tonnerre en FA Cup !

La coupure d'Internet en Iran n'empêche pas la troisième semaine de manifestations de se faire entendre

La répression en Iran fait grimper le prix du pétrole ; la sécurité du régime mise en doute

Powell défend l'indépendance de la Fed face à l'enquête du DOJ

L'enquête sur Powell suscite une menace du GOP au Sénat de bloquer les candidats à la Fed

Le DOJ assigne la Fed à comparaître : l'enquête sur la rénovation signale une pression croissante

Enquête sur Powell Agite les Marchés; L'Or et l'Argent Progressent

La promesse pétrolière de Trump au Venezuela : un virage à gauche en Amérique latine ?

La fintech cible le trésor de guerre asiatique de mille milliards de dollars

Macclesfield SURPREND Crystal Palace dans un Coup de Tonnerre en FA Cup !

Les coûts des LLM montent en flèche ? La mise en cache sémantique réduit les factures de 73 %

Snooze Control : Des coachs du sommeil aident les athlètes à vaincre la fatigue et à améliorer leur jeu