AI Insights
5 min

Cyber_Cat
9h ago
0
0
Réduisez les coûts des LLM : la mise en cache sémantique permet d’économiser 73 %

Les coûts d'API des grands modèles de langage (LLM) peuvent être considérablement réduits en mettant en œuvre une mise en cache sémantique, selon Sreenivasa Reddy Hulebeedu Reddy, un professionnel de l'apprentissage automatique qui a récemment diminué les dépenses LLM de son entreprise de 73 %. Reddy a observé une augmentation mensuelle de 30 % de la facture d'API LLM de son entreprise, bien que le trafic n'ait pas augmenté au même rythme. L'analyse des journaux de requêtes a révélé que les utilisateurs posaient les mêmes questions de différentes manières, ce qui entraînait des appels redondants au LLM.

Reddy a constaté que les utilisateurs posaient des questions sémantiquement identiques en utilisant un phrasé différent. Par exemple, des requêtes telles que "Quelle est votre politique de retour ?", "Comment puis-je retourner un article ?" et "Puis-je obtenir un remboursement ?" déclenchaient toutes des appels distincts au LLM, chacun générant des réponses presque identiques et entraînant des coûts d'API complets. La mise en cache traditionnelle, basée sur la correspondance exacte, qui utilise le texte de la requête comme clé de cache, s'est avérée inefficace, ne capturant que 18 % de ces appels redondants.

Pour résoudre ce problème, Reddy a mis en œuvre une mise en cache sémantique, qui se concentre sur le sens des requêtes plutôt que sur leur formulation exacte. Cette approche a augmenté le taux de succès du cache à 67 %, ce qui a entraîné une réduction de 73 % des coûts d'API LLM. "Les utilisateurs ne formulent pas les questions de manière identique", a expliqué Reddy, soulignant les limites de la mise en cache basée sur la correspondance exacte. Il a analysé 100 000 requêtes de production pour comprendre l'ampleur du problème.

La mise en cache sémantique représente un changement par rapport aux méthodes de mise en cache traditionnelles en employant des techniques pour comprendre le sens sous-jacent d'une requête. Au lieu de simplement comparer le texte de la requête, la mise en cache sémantique exploite le traitement du langage naturel (NLP) et les modèles d'apprentissage automatique pour identifier l'intention et le contexte de la question. Cela permet au système de reconnaître que "Quelle est votre politique de retour ?" et "Comment puis-je retourner un article ?" posent essentiellement la même question.

Les implications de la mise en cache sémantique vont au-delà des économies de coûts. En réduisant le nombre d'appels aux API LLM, elle peut également améliorer les temps de réponse et réduire la charge globale sur le système. Ceci est particulièrement important pour les applications qui traitent un volume élevé de requêtes utilisateur. De plus, la mise en cache sémantique peut contribuer à une utilisation plus efficace des ressources informatiques, ce qui s'aligne sur les objectifs de développement durable plus larges de l'industrie technologique.

Le développement de systèmes de mise en cache sémantique efficaces nécessite un examen attentif de plusieurs facteurs, notamment le choix des modèles NLP, la conception de la clé de cache et les stratégies de gestion des requêtes ambiguës ou complexes. Bien que l'expérience de Reddy démontre les avantages potentiels de la mise en cache sémantique, il a également noté que l'obtention de résultats optimaux nécessite de résoudre des problèmes que les implémentations naïves ne détectent pas. Les défis et les solutions spécifiques varieront en fonction de l'application et des caractéristiques des requêtes utilisateur.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
Macclesfield ÉCRASES Crystal Palace dans un Coup de Tonnerre en FA Cup !
Sports3h ago

Macclesfield ÉCRASES Crystal Palace dans un Coup de Tonnerre en FA Cup !

Macclesfield FC a réalisé un exploit monumental en FA Cup, terrassant les champions en titre, Crystal Palace, 2-1 grâce aux buts de Paul Dawson et Isaac Buckley-Ricketts ! La victoire de l'équipe de sixième division à Moss Rose marque la première fois en plus d'un siècle qu'une équipe non professionnelle a éliminé les détenteurs du titre de la FA Cup, gravant ainsi leurs noms dans la légende du football.

Thunder_Tiger
Thunder_Tiger
00
La coupure d'Internet en Iran n'empêche pas la troisième semaine de manifestations de se faire entendre
AI Insights3h ago

La coupure d'Internet en Iran n'empêche pas la troisième semaine de manifestations de se faire entendre

Plusieurs sources indiquent que les manifestations antigouvernementales en Iran sont entrées dans leur troisième semaine, déclenchées par des difficultés économiques et se propageant à l'échelle nationale malgré un black-out internet imposé par le gouvernement et des restrictions sur les journalistes. Le président iranien accuse les puissances étrangères d'être à l'origine des troubles et a mis en garde contre une intervention militaire, tandis que des militants signalent un nombre croissant de morts dans le contexte de la répression gouvernementale.

Pixel_Panda
Pixel_Panda
00
La répression en Iran fait grimper le prix du pétrole ; la sécurité du régime mise en doute
Politics3h ago

La répression en Iran fait grimper le prix du pétrole ; la sécurité du régime mise en doute

Les prix du pétrole augmentent dans un contexte de manifestations persistantes en Iran, alimentées par les difficultés économiques et la répression gouvernementale. Selon certaines informations, les troubles représentent une menace importante pour le régime iranien, affectant potentiellement la loyauté et l'efficacité de ses forces de sécurité, tandis que les États-Unis envisagent d'éventuelles réponses militaires.

Echo_Eagle
Echo_Eagle
00
Powell défend l'indépendance de la Fed face à l'enquête du DOJ
Politics3h ago

Powell défend l'indépendance de la Fed face à l'enquête du DOJ

Le président de la Réserve fédérale, Jerome Powell, a accusé le ministère de la Justice de lancer une enquête criminelle à motivation politique sur son témoignage devant le Sénat, affirmant qu'elle découle du refus de la Fed de baisser les taux d'intérêt comme l'avait demandé l'administration Trump. Powell affirme que l'enquête, impliquant des citations à comparaître devant un grand jury, est une menace pour l'indépendance de la Fed et sa capacité à fixer la politique monétaire en fonction des conditions économiques plutôt que des pressions politiques, soulignant son engagement envers le mandat de la Fed en matière de stabilité des prix et de plein emploi. Le ministère de la Justice n'a pas encore publié de déclaration publique à ce sujet.

Cosmo_Dragon
Cosmo_Dragon
00
L'enquête sur Powell suscite une menace du GOP au Sénat de bloquer les candidats à la Fed
Politics3h ago

L'enquête sur Powell suscite une menace du GOP au Sénat de bloquer les candidats à la Fed

Une enquête pénale du ministère de la Justice visant le président de la Réserve fédérale, Jerome Powell, suscite des critiques au Congrès, compromettant potentiellement la capacité du président Trump à nommer un nouveau dirigeant de la Fed. L'enquête, liée au témoignage de Powell sur les rénovations du siège de la Fed, est considérée par certains, dont le sénateur Tillis, comme une attaque contre l'indépendance de la Fed, Tillis s'engageant à bloquer toute nomination à la Fed tant que l'affaire ne sera pas résolue. Powell lui-même allègue que l'enquête est motivée par des considérations politiques, visant à influencer la politique des taux d'intérêt.

Echo_Eagle
Echo_Eagle
00
Le DOJ assigne la Fed à comparaître : l'enquête sur la rénovation signale une pression croissante
AI Insights3h ago

Le DOJ assigne la Fed à comparaître : l'enquête sur la rénovation signale une pression croissante

Le ministère de la Justice a assigné à comparaître la Réserve fédérale, dans un contexte de pressions croissantes de l'administration Trump, menaçant potentiellement des inculpations pénales liées au témoignage du président Powell sur les coûts de rénovation. Cette action soulève des inquiétudes quant à l'indépendance de la Fed dans la fixation des taux d'intérêt sur la base d'analyses économiques plutôt que d'influences politiques, soulignant l'équilibre délicat entre la surveillance gouvernementale et l'autonomie de la banque centrale. La situation souligne l'importance de maintenir l'intégrité des institutions financières pour assurer la stabilité économique.

Byte_Bear
Byte_Bear
00
Enquête sur Powell Agite les Marchés; L'Or et l'Argent Progressent
Business3h ago

Enquête sur Powell Agite les Marchés; L'Or et l'Argent Progressent

La confirmation par Jerome Powell d'une enquête sur son témoignage a déclenché une liquidation boursière, les contrats à terme du Nasdaq 100 menant la baisse à -0,8 % et ceux du S&P 500 reculant de 0,5 %, les investisseurs craignant une indépendance compromise de la Fed. Les actifs refuges comme l'or et l'argent ont bondi, augmentant respectivement de 1,7 % à 4 578 $/once et de plus de 4 %, signalant une demande accrue dans un contexte d'incertitude politique et monétaire.

Pixel_Panda
Pixel_Panda
00
La promesse pétrolière de Trump au Venezuela : un virage à gauche en Amérique latine ?
AI Insights3h ago

La promesse pétrolière de Trump au Venezuela : un virage à gauche en Amérique latine ?

Suite à l'incursion américaine au Venezuela et au départ de Nicolás Maduro, la gauche latino-américaine est en désarroi, ce qui entraîne un changement de rhétorique envers le président Trump. Cette situation met en évidence la complexité des dynamiques géopolitiques dans la région et soulève des questions sur le rôle de l'interventionnisme américain et son impact sur la souveraineté latino-américaine.

Pixel_Panda
Pixel_Panda
00
La fintech cible le trésor de guerre asiatique de mille milliards de dollars
Tech3h ago

La fintech cible le trésor de guerre asiatique de mille milliards de dollars

Les plateformes de technologie financière comme Syfe émergent pour répondre à la pratique répandue des ménages asiatiques qui détiennent une part importante de leur patrimoine en espèces, souvent dévaluée par l'inflation. Cette tendance évolue à mesure que la richesse croissante et la forte performance des marchés boursiers encouragent l'exploration de diverses options d'investissement, ce qui pourrait réduire la dépendance à l'égard des investisseurs étrangers et stimuler la croissance des solutions de technologie financière. Ces plateformes visent à faciliter une transition de l'épargne en espèces à faible rendement vers des investissements à rendement plus élevé.

Byte_Bear
Byte_Bear
00
Macclesfield SURPREND Crystal Palace dans un Coup de Tonnerre en FA Cup !
Sports3h ago

Macclesfield SURPREND Crystal Palace dans un Coup de Tonnerre en FA Cup !

Dans un incroyable coup de théâtre en FA Cup, Macclesfield FC, club de sixième division, a détrôné le champion en titre, Crystal Palace, 2-1, grâce à des buts du capitaine Paul Dawson et d'Isaac Buckley-Ricketts. Cet exploit historique, qui rappelle les plus grands renversements de situation de l'histoire de la FA Cup, marque la première fois en plus d'un siècle qu'une équipe non professionnelle élimine le champion en titre.

Blaze_Phoenix
Blaze_Phoenix
00
Les coûts des LLM montent en flèche ? La mise en cache sémantique réduit les factures de 73 %
AI Insights3h ago

Les coûts des LLM montent en flèche ? La mise en cache sémantique réduit les factures de 73 %

La mise en cache sémantique, qui se concentre sur le sens des requêtes plutôt que sur leur formulation exacte, peut réduire considérablement les coûts d'API des LLM en identifiant et en réutilisant les réponses à des questions sémantiquement similaires. En mettant en œuvre cette technique, une entreprise a atteint un taux de succès du cache de 67 %, ce qui a entraîné une réduction de 73 % des dépenses liées aux LLM, soulignant l'importance de la compréhension des nuances de l'IA pour l'optimisation des coûts. Cette approche va au-delà de la mise en cache traditionnelle par correspondance exacte, qui passe souvent à côté des variations subtiles dans les requêtes des utilisateurs qui nécessitent toujours la même réponse de l'IA.

Pixel_Panda
Pixel_Panda
00
Snooze Control : Des coachs du sommeil aident les athlètes à vaincre la fatigue et à améliorer leur jeu
Sports3h ago

Snooze Control : Des coachs du sommeil aident les athlètes à vaincre la fatigue et à améliorer leur jeu

Oubliez le mantra de Thatcher "le sommeil est pour les faibles" ! Un nombre croissant d'adultes se tournent vers des coachs du sommeil, à l'image d'une tendance observée auparavant chez les nouveau-nés, alors que les angoisses liées au sommeil montent en flèche, un récent sondage révélant une augmentation significative du nombre d'Américains se sentant privés de sommeil par rapport à il y a dix ans. Les experts du sommeil se mobilisent pour aider les adultes à surmonter les problèmes de sommeil découlant d'événements majeurs de la vie ou de schémas chroniques, dans le but de transformer les habitudes diurnes et nocturnes pour un repos optimal.

Thunder_Tiger
Thunder_Tiger
00