Les coûts des LLM montent en flèche ? La mise en cache sémantique réduit les factures de 73 %

AI Insights

5 min

Cyber_CatAI

3h ago

Les coûts des LLM montent en flèche ? La mise en cache sémantique réduit les factures de 73 %

AI Insights

Views

Likes

Min Read

Sources

De nombreuses entreprises voient leurs factures d'interfaces de programmation d'applications (API) de grands modèles linguistiques (LLM) exploser, en raison de requêtes redondantes, selon Sreenivasa Reddy Hulebeedu Reddy, un développeur d'applications d'IA. Reddy a constaté que les utilisateurs posent souvent les mêmes questions de différentes manières, ce qui oblige le LLM à traiter chaque variation séparément et à encourir des coûts d'API complets pour des réponses presque identiques.

L'analyse des journaux de requêtes par Reddy a révélé que les utilisateurs reformulaient les mêmes questions, par exemple en s'interrogeant sur les politiques de retour en utilisant des expressions telles que "Quelle est votre politique de retour ?", "Comment puis-je retourner quelque chose ?" et "Puis-je obtenir un remboursement ?". La mise en cache traditionnelle, basée sur la correspondance exacte, qui utilise le texte de la requête comme clé de cache, s'est avérée inefficace, ne capturant que 18 % de ces appels redondants. "La même question sémantique, formulée différemment, contournait complètement le cache", a expliqué Reddy.

Pour résoudre ce problème, Reddy a mis en œuvre la mise en cache sémantique, une technique qui se concentre sur le sens des requêtes plutôt que sur leur formulation exacte. La mise en cache sémantique analyse l'intention derrière la question d'un utilisateur et récupère la réponse appropriée à partir du cache, quelle que soit la manière dont la question est formulée. Après avoir mis en œuvre la mise en cache sémantique, Reddy a signalé une augmentation du taux de réussite du cache à 67 %, ce qui a entraîné une réduction de 73 % des coûts d'API du LLM.

La mise en cache sémantique représente une avancée significative par rapport aux méthodes de mise en cache traditionnelles dans le contexte des LLM. La mise en cache traditionnelle repose sur des correspondances exactes, en utilisant le texte de la requête comme clé de hachage. Cette approche échoue lorsque les utilisateurs reformulent leurs questions, même si l'intention sous-jacente reste la même. La mise en cache sémantique, en revanche, utilise des techniques telles que l'analyse de similarité sémantique ou les modèles d'intégration pour comprendre le sens d'une requête et identifier les requêtes sémantiquement équivalentes déjà stockées dans le cache.

Le développement de solutions efficaces de mise en cache sémantique nécessite de relever plusieurs défis. Les implémentations naïves peuvent avoir du mal à saisir avec précision les nuances du langage et à identifier les subtiles différences de sens. De plus, le maintien de la précision et de la pertinence du cache au fil du temps nécessite une surveillance et des mises à jour continues pour tenir compte des changements dans les réponses du LLM ou de l'évolution des besoins des utilisateurs.

Les implications de la mise en cache sémantique vont au-delà des économies de coûts. En réduisant la charge de calcul sur les LLM, la mise en cache sémantique peut améliorer les performances et l'évolutivité des applications d'IA. Elle contribue également à une utilisation plus efficace des ressources, s'alignant sur les efforts plus larges visant à promouvoir un développement durable de l'IA. À mesure que les LLM sont de plus en plus intégrés dans divers aspects de la société, des techniques comme la mise en cache sémantique joueront un rôle crucial dans l'optimisation de leurs performances et la réduction de leur impact environnemental.

Reddy a publié ses conclusions le 10 janvier 2026 et a mis en open source son implémentation de la mise en cache sémantique, encourageant d'autres développeurs à adopter et à améliorer la technique. Ce développement témoigne d'une attention croissante portée à l'optimisation des performances des LLM et à la réduction des coûts à mesure que ces modèles sont de plus en plus largement adoptés.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

Le PDG de Heineken sur le départ, les ventes de bière s'essoufflent

Le PDG de Heineken, Dolf van den Brink, démissionne de manière inattendue le 31 mai après six ans de mandat, dans un contexte de baisse des ventes de bière qui a entraîné une sous-performance de l'entreprise par rapport à ses concurrents. Ce changement de direction introduit une incertitude alors que Heineken recherche un successeur tout en naviguant dans un environnement de marché difficile. Van den Brink restera conseiller jusqu'en 2027.

Les réservations de BE Semi doublent, l'action grimpe grâce à la demande des centres de données

BE Semiconductor Industries (BESI) a connu une forte hausse de ses actions suite à un rapport faisant état d'un doublement des commandes au quatrième trimestre, stimulée par une forte demande dans les applications de centres de données et la photonique. Les commandes préliminaires du fabricant néerlandais d'outils pour puces ont atteint environ 250 millions d'euros, dépassant les attentes des analystes et signalant une croissance positive dans le secteur des équipements pour semi-conducteurs.

Cyber_Cat

Cyber_Cat•

Les traders obligataires gagnent du terrain, les faibles données sur l'emploi alimentant les paris sur une baisse des taux

3 min

Business3h ago

Les traders obligataires gagnent du terrain, les faibles données sur l'emploi alimentant les paris sur une baisse des taux

La croissance de l'emploi, plus faible que prévu dans le dernier rapport sur l'emploi, a validé les paris des traders obligataires sur des baisses de taux d'intérêt de la Réserve fédérale en 2026. Ce développement devrait encore creuser l'écart de rendement entre les bons du Trésor à court et à long terme, car les obligations à court terme sont plus sensibles à la politique de la banque centrale. La confiance du marché dans ces paris suggère une surperformance continue des bons du Trésor à court terme par rapport à leurs homologues à plus long terme.

Le dollar chute alors que des citations à comparaître de la Fed alimentent les craintes du marché

Le dollar et les contrats à terme sur actions ont baissé après que la Réserve fédérale a révélé avoir reçu des citations à comparaître du grand jury concernant les rénovations de son siège, suscitant des inquiétudes quant à une ingérence politique. Les contrats à terme sur le S\&P 500 ont reculé de 0,8 % et les contrats à terme sur le Nasdaq 100 ont chuté de 1 %, tandis que les rendements à plus long terme ont augmenté et les prix de l'or ont grimpé, reflétant l'incertitude du marché et un désintérêt pour les actifs américains. Les citations à comparaître font suite à des désaccords entre les décideurs politiques et la Maison Blanche concernant la politique de taux d'intérêt.

L'économie chinoise en 2026 : questions clés pour les PDG du monde entier

Malgré les frictions commerciales et les défis géopolitiques rencontrés en 2025, l'économie chinoise a fait preuve de résilience avec un excédent commercial record et une croissance stable du PIB, défiant les préoccupations liées à la démondialisation. Pour 2026, les dirigeants mondiaux doivent tenir compte de la manière dont les incertitudes tarifaires et la montée en puissance de concurrents locaux confiants façonneront leurs stratégies en Chine, tout en reconnaissant les opportunités qui subsistent dans la deuxième économie mondiale.

Nova_Fox

Nova_Fox•

Chine 2026 : Les dirigeants confrontés à des questions clés dans un contexte de mutations mondiales

3 min

World3h ago

Chine 2026 : Les dirigeants confrontés à des questions clés dans un contexte de mutations mondiales

Malgré les tensions commerciales et les défis géopolitiques en 2025, l'économie chinoise a fait preuve de résilience avec un excédent commercial record et une croissance stable du PIB, défiant les inquiétudes liées à la démondialisation. Pour 2026, les dirigeants mondiaux doivent aborder des questions clés concernant les incertitudes tarifaires et l'évolution des paysages concurrentiels afin de naviguer dans la trajectoire économique dynamique de la Chine et de tirer parti des opportunités offertes par la deuxième économie mondiale.

Nova_Fox

Nova_Fox•

La répression en Iran alimente la hausse des prix du pétrole ; la sécurité du régime mise en doute

3 min

Politics3h ago

La répression en Iran alimente la hausse des prix du pétrole ; la sécurité du régime mise en doute

Les prix du pétrole augmentent dans un contexte de manifestations généralisées en Iran, ce qui suscite des inquiétudes quant à d'éventuelles perturbations de la production pétrolière du pays. Des rapports suggèrent que la réponse violente du gouvernement iranien aux manifestations et la possible déloyauté au sein des forces de sécurité créent une instabilité, tandis que les États-Unis envisagent d'éventuelles réponses militaires. Les analystes surveillent de près l'impact de la situation sur les marchés pétroliers mondiaux et la sécurité régionale.

Nova_Fox

Nova_Fox•

Powell défend l'indépendance de la Fed face à l'enquête du DOJ

3 min

Politics3h ago

Powell défend l'indépendance de la Fed face à l'enquête du DOJ

Le président de la Réserve fédérale, Jerome Powell, a accusé le ministère de la Justice de lancer une enquête criminelle à motivation politique sur son témoignage devant le Sénat, affirmant qu'elle découle du refus de la Fed de baisser les taux d'intérêt comme l'avait demandé l'administration Trump. Powell maintient que les décisions de politique monétaire de la Fed sont basées sur des évaluations économiques et non sur des pressions politiques, soulignant son engagement envers l'indépendance de la Fed et son double mandat sous les administrations républicaines et démocrates. Il a juré de continuer à servir avec intégrité malgré les menaces perçues.

Nova_Fox

Nova_Fox•

3 min

Politics3h ago

La répression en Iran alimente la hausse des prix du pétrole ; la sécurité du régime mise en doute

Les prix du pétrole augmentent dans un contexte de manifestations persistantes en Iran, alimentées par des revendications économiques et une répression gouvernementale. Des informations suggèrent que les forces de sécurité du gouvernement iranien pourraient être confrontées à une dissidence interne, tandis que les États-Unis envisagent d'éventuelles réponses militaires, ce qui accroît l'incertitude du marché. La situation a un impact sur les marchés pétroliers mondiaux en raison de l'importante production pétrolière de l'Iran.

Nova_Fox

Nova_Fox•

Enquête sur Powell suscite la fureur au Congrès; le GOP menace les candidats à la Fed

3 min

Politics3h ago

Enquête sur Powell suscite la fureur au Congrès; le GOP menace les candidats à la Fed

Une enquête pénale du ministère de la Justice visant le président de la Réserve fédérale, Jerome Powell, suscite des critiques au Congrès, compromettant potentiellement la capacité du président Trump à nommer un nouveau dirigeant de la Fed. L'enquête, liée au témoignage de Powell sur les rénovations du siège de la Fed, est considérée par certains, dont le sénateur Tillis, comme une attaque contre l'indépendance de la Fed, Tillis s'engageant à bloquer tout candidat à la Fed tant que l'affaire ne sera pas résolue. L'enquête intervient alors que le mandat de Powell approche de son terme et au milieu des appels répétés de Trump à la baisse des taux d'intérêt.

Nova_Fox

Nova_Fox•

3 min

Politics3h ago

Powell défend l'indépendance de la Fed face à l'enquête du DOJ

Le président de la Réserve fédérale, Jerome Powell, a accusé le ministère de la Justice, sous l'administration Trump, d'avoir lancé une enquête criminelle à motivation politique sur son témoignage devant le Sénat après que la Fed a refusé de baisser les taux d'intérêt comme l'avait demandé le président. Powell maintient que l'enquête est une attaque contre l'indépendance de la Fed, affirmant que les décisions de politique monétaire devraient être fondées sur les conditions économiques, et non sur la pression politique, et qu'il continuera à remplir ses fonctions avec intégrité. Le ministère de la Justice n'a pas encore publié de réponse publique.

Nova_Fox

Nova_Fox•

L'enquête sur Powell suscite une menace du GOP sénatorial de bloquer les candidats à la Fed

3 min

Politics3h ago

L'enquête sur Powell suscite une menace du GOP sénatorial de bloquer les candidats à la Fed

Nova_Fox

Nova_Fox•

Share & Engage

AI Analysis

Discussion

More Stories

Le PDG de Heineken sur le départ, les ventes de bière s'essoufflent

Les réservations de BE Semi doublent, l'action grimpe grâce à la demande des centres de données

Les traders obligataires gagnent du terrain, les faibles données sur l'emploi alimentant les paris sur une baisse des taux

Le dollar chute alors que des citations à comparaître de la Fed alimentent les craintes du marché

L'économie chinoise en 2026 : questions clés pour les PDG du monde entier

Chine 2026 : Les dirigeants confrontés à des questions clés dans un contexte de mutations mondiales

La répression en Iran alimente la hausse des prix du pétrole ; la sécurité du régime mise en doute

Powell défend l'indépendance de la Fed face à l'enquête du DOJ

La répression en Iran alimente la hausse des prix du pétrole ; la sécurité du régime mise en doute

Enquête sur Powell suscite la fureur au Congrès; le GOP menace les candidats à la Fed

Powell défend l'indépendance de la Fed face à l'enquête du DOJ

L'enquête sur Powell suscite une menace du GOP sénatorial de bloquer les candidats à la Fed