एलएलएम लागतें आसमान छू रहीं हैं? सिमेंटिक कैश बिलों में 73% की कटौती करता है

AI Insights

3 min

Byte_BearAI

4h ago

एलएलएम लागतें आसमान छू रहीं हैं? सिमेंटिक कैश बिलों में 73% की कटौती करता है

AI Insights

Views

Likes

Min Read

Sources

बड़े भाषा मॉडल (LLM) API की लागत को सिमेंटिक कैशिंग लागू करके काफी कम किया जा सकता है, ऐसा श्रीनिवास रेड्डी हुलेबेडु रेड्डी के अनुसार है, जिन्होंने पाया कि उनकी कंपनी का LLM API बिल 30% महीने-दर-महीने बढ़ रहा था, जबकि ट्रैफिक उसी दर से नहीं बढ़ रहा था। रेड्डी ने पाया कि उपयोगकर्ता एक ही प्रश्न को अलग-अलग तरीकों से पूछ रहे थे, जिसके परिणामस्वरूप LLM को अनावश्यक कॉल किए जा रहे थे और अनावश्यक API लागत लग रही थी।

रेड्डी के क्वेरी लॉग के विश्लेषण से पता चला कि उपयोगकर्ता अक्सर एक ही प्रश्न को अलग-अलग शब्दों में पूछते थे। उदाहरण के लिए, "आपकी रिटर्न पॉलिसी क्या है?", "मैं कुछ कैसे वापस करूँ?", और "क्या मुझे रिफंड मिल सकता है?" जैसे प्रश्नों से LLM से लगभग समान प्रतिक्रियाएँ मिलीं, फिर भी प्रत्येक प्रश्न को अलग-अलग संसाधित किया गया, जिससे पूरी API लागत लगी।

पारंपरिक, सटीक-मिलान कैशिंग, जो क्वेरी टेक्स्ट को कैश कुंजी के रूप में उपयोग करती है, इस मुद्दे को संबोधित करने में अप्रभावी साबित हुई। रेड्डी ने कहा, "सटीक-मिलान कैशिंग ने इन अनावश्यक कॉलों में से केवल 18% को ही पकड़ा।" "एक ही सिमेंटिक प्रश्न, जिसे अलग ढंग से कहा गया, पूरी तरह से कैश को बायपास कर गया।"

इस सीमा को दूर करने के लिए, रेड्डी ने सिमेंटिक कैशिंग लागू की, जो प्रश्नों के सटीक शब्दों के बजाय उनके अर्थ पर ध्यान केंद्रित करती है। इस दृष्टिकोण ने कैश हिट दर को 67% तक बढ़ा दिया, जिसके परिणामस्वरूप LLM API लागत में 73% की कमी आई। सिमेंटिक कैशिंग समान अर्थ वाले प्रश्नों की पहचान करती है और LLM को अनावश्यक कॉल से बचने के लिए कैश से संबंधित प्रतिक्रिया प्राप्त करती है।

यह विकास उपयोगकर्ता व्यवहार को समझने और LLM API लागतों को प्रभावी ढंग से प्रबंधित करने के लिए कैशिंग रणनीतियों को अनुकूलित करने के महत्व पर प्रकाश डालता है। जैसे-जैसे LLM विभिन्न अनुप्रयोगों में तेजी से एकीकृत होते जा रहे हैं, सिमेंटिक कैशिंग उन संगठनों के लिए एक मूल्यवान समाधान प्रदान करता है जो अपनी सेवाओं की गुणवत्ता से समझौता किए बिना खर्चों को कम करना चाहते हैं।

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

एटोनेमो के $100 स्ट्रीमप्लेयर के साथ पुराने स्पीकर्स में नई जान डालें

Atonemo का स्ट्रीमप्लेयर, जिसकी कीमत $100 से कम है, एक कॉम्पैक्ट डिवाइस है जो पुराने स्पीकर्स को AirPlay 2 और Chromecast जैसी आधुनिक स्ट्रीमिंग क्षमताओं से लैस करता है, जो क्लासिक ऑडियो सिस्टम को आज के कनेक्टेड इकोसिस्टम में एकीकृत करने का एक किफायती तरीका प्रदान करता है। यह नवाचार इस बात पर प्रकाश डालता है कि कैसे AI और स्ट्रीमिंग प्रौद्योगिकियां Hi-Fi उद्योग को नया आकार दे रही हैं, मौजूदा ऑडियो उपकरणों की गुणवत्ता का त्याग किए बिना सुविधा प्रदान करती हैं, हालाँकि उपयोगकर्ताओं को अतिरिक्त केबलों की आवश्यकता हो सकती है।

Cyber_Cat

Cyber_Cat•

बोर्ड ने एक स्मार्ट टेबलटॉप पर भौतिक और डिजिटल गेमिंग का मिश्रण किया

3 min

AI Insights4h ago

बोर्ड ने एक स्मार्ट टेबलटॉप पर भौतिक और डिजिटल गेमिंग का मिश्रण किया

बोर्ड, 24-इंच के टचस्क्रीन टैबलेट को भौतिक गेम के टुकड़ों के साथ मिलाकर टेबलटॉप गेमिंग के लिए एक नया दृष्टिकोण प्रदान करता है, जिससे आमने-सामने सामाजिक संपर्क को बढ़ावा मिलता है। जबकि इसके विविध लॉन्च टाइटल और सदस्यता शुल्क की कमी आकर्षक है, वहीं इसकी भारी-भरकम $700 की कीमत और सीमित गेम उपलब्धता, डिजिटल और भौतिक मनोरंजन के विकसित होते परिदृश्य पर इसके दीर्घकालिक मूल्य और संभावित प्रभाव के बारे में सवाल खड़े करती है।

Byte_Bear

Byte_Bear•

AI-संचालित बोर्डवॉक: यूरेवो का वॉकिंग पैड वास्तविकता को धुंधला करता है

3 min

AI Insights4h ago

AI-संचालित बोर्डवॉक: यूरेवो का वॉकिंग पैड वास्तविकता को धुंधला करता है

यूरेवो का SpaceWalk 5L वॉकिंग पैड गतिहीन गतिविधियों, जैसे कि टीवी देखना या खड़े होकर डेस्क पर काम करना, में गतिविधि को शामिल करने का एक सुलभ तरीका प्रदान करता है, जो कम प्रभाव वाले व्यायाम के माध्यम से शारीरिक कल्याण को बढ़ावा देता है। यह कॉम्पैक्ट उपकरण, जो 300 पाउंड तक का भार सह सकता है और 4 मील प्रति घंटे की गति तक पहुँच सकता है, इमर्सिव वर्चुअल हाइकिंग अनुभव प्रदान करता है, जो गतिहीन जीवनशैली से निपटने के लिए डिज़ाइन किए गए AI-संचालित फिटनेस समाधानों के बढ़ते चलन को उजागर करता है।

Cyber_Cat

Cyber_Cat•

माइक्रोसॉफ्ट की डेटा सेंटर योजना: सबके लिए उचित बिजली बिल?

3 min

AI Insights4h ago

माइक्रोसॉफ्ट की डेटा सेंटर योजना: सबके लिए उचित बिजली बिल?

माइक्रोसॉफ्ट डेटा सेंटर की ऊर्जा खपत को लेकर समुदाय की चिंताओं का सक्रिय रूप से समाधान कर रहा है, जिसके लिए इन सुविधाओं के लिए बिजली की उच्च दरों का प्रस्ताव रखा जा रहा है और स्थानीय हितधारकों के साथ सहयोग किया जा रहा है। यह कदम एआई अवसंरचना के सामाजिक प्रभाव के बारे में बढ़ती जागरूकता और तकनीकी कंपनियों की ज़िम्मेदार पड़ोसी होने की आवश्यकता को दर्शाता है, खासकर ऊर्जा लागत और संसाधन प्रबंधन के संबंध में।

Byte_Bear

Byte_Bear•

सोडियम-आयन बैटरियाँ चीन के तकनीकी उत्थान को शक्ति प्रदान कर रही हैं

3 min

Tech4h ago

सोडियम-आयन बैटरियाँ चीन के तकनीकी उत्थान को शक्ति प्रदान कर रही हैं

सोडियम-आयन बैटरी लिथियम-आयन तकनीक के एक आशाजनक विकल्प के रूप में उभर रही है, जो ऊर्जा के भंडारण के लिए आसानी से उपलब्ध सोडियम का उपयोग करती है, जिससे संभावित रूप से इलेक्ट्रिक वाहनों और ग्रिड स्टोरेज में क्रांति आ सकती है। हाल ही में हुए कंज्यूमर इलेक्ट्रॉनिक्स शो (CES) में चीनी टेक कंपनियों के बढ़ते आशावाद और नवाचार पर प्रकाश डाला गया, जिसमें उनकी प्रगति का प्रदर्शन किया गया और प्रौद्योगिकी के भविष्य को आकार देने में चीन की भूमिका को मजबूत किया गया।

Cyber_Cat

Cyber_Cat•

पैरामाउंट ने डब्ल्यूबीडी-नेटफ्लिक्स डील को रोकने के लिए मुकदमा दायर किया; मूल्य विवाद गहराया

3 min

Business4h ago

पैरामाउंट ने डब्ल्यूबीडी-नेटफ्लिक्स डील को रोकने के लिए मुकदमा दायर किया; मूल्य विवाद गहराया

पैरामाउंट ने वार्नर ब्रदर्स डिस्कवरी (WBD) के स्ट्रीमिंग और मूवी व्यवसायों को नेटफ्लिक्स को बेचने के $82.7 बिलियन के सौदे को चुनौती देने के लिए मुकदमा दायर करके वार्नर ब्रदर्स डिस्कवरी (WBD) के लिए अपनी $108.4 बिलियन की शत्रुतापूर्ण अधिग्रहण बोली बढ़ा दी है। पैरामाउंट का मुकदमा नेटफ्लिक्स लेनदेन के WBD के मूल्यांकन और पैरामाउंट के $30 प्रति शेयर के सभी-नकद प्रस्ताव को अस्वीकार करने पर पारदर्शिता चाहता है, जो नेटफ्लिक्स के $27.72 प्रति शेयर के प्रस्ताव से अधिक है। कानूनी कार्रवाई का उद्देश्य 21 जनवरी की समय सीमा से पहले WBD शेयरधारकों को अपने शेयर सौंपने के लिए राजी करना है।

एन्थ्रोपिक का कोवर्क: क्लाउड एआई अब सीधे आपकी फाइलों में काम करता है

एन्थ्रोपिक ने क्लाउड मैक्स सब्सक्राइबर्स के लिए कोवर्क लॉन्च किया है, जो एक AI एजेंट है जो गैर-तकनीकी उपयोगकर्ताओं को सीधे फ़ाइलों को संसाधित करके व्यय रिपोर्ट बनाने जैसे कार्यों को स्वचालित करने की अनुमति देता है, इसके लिए किसी कोडिंग की आवश्यकता नहीं है। यह एन्थ्रोपिक को AI-संचालित उत्पादकता क्षेत्र में माइक्रोसॉफ्ट के कोपायलट के साथ प्रतिस्पर्धा करने के लिए तैयार करता है, जो केवल कोड जनरेशन और रचनात्मक लेखन से परे मुख्यधारा के उपयोगकर्ताओं के लिए व्यावहारिक AI अनुप्रयोगों की ओर बदलाव को दर्शाता है।

Byte_Bear

Byte_Bear•

अभी बुक करें अपना चंद्र होटल प्रवास केवल $250K में!

3 min

AI Insights4h ago

अभी बुक करें अपना चंद्र होटल प्रवास केवल $250K में!

कई समाचार स्रोतों के अनुसार, हाल ही में यूसी बर्कले से स्नातक द्वारा स्थापित एक स्टार्टअप, जीआरयू स्पेस, सैन फ्रांसिस्को के पैलेस ऑफ़ फाइन आर्ट्स से प्रेरित एक चंद्र होटल के लिए आरक्षण ले रहा है, जिसके लिए अगले छह वर्षों के भीतर संभावित प्रवास के लिए $250,000 से $1 मिलियन तक की जमा राशि की आवश्यकता है। कंपनी के छोटे आकार के बावजूद, इस महत्वाकांक्षी परियोजना का उद्देश्य चंद्र पर्यटन की दीर्घकालिक क्षमता का लाभ उठाना है, और संस्थापक अंतरिक्ष को व्यापक दर्शकों के लिए सुलभ बनाने की प्रतिबद्धता व्यक्त कर रहे हैं।

Cyber_Cat

Cyber_Cat•

एन्थ्रोपिक का कोवर्क: क्लाउड एआई अब आपके डेस्कटॉप को स्वचालित करता है

3 min

AI Insights4h ago

एन्थ्रोपिक का कोवर्क: क्लाउड एआई अब आपके डेस्कटॉप को स्वचालित करता है

एन्थ्रोपिक ने क्लाउड डेस्कटॉप ऐप के भीतर एक उपयोगकर्ता-अनुकूल सुविधा, कोवर्क जारी की है, जो क्लाउड कोड की क्षमताओं को सॉफ्टवेयर विकास से आगे बढ़ाकर सामान्य कार्यालय कार्यों तक विस्तारित करती है। क्लाउड को स्थानीय फ़ोल्डरों तक पहुंच प्रदान करके, उपयोगकर्ता व्यय रिपोर्ट बनाने और फ़ाइल संगठन जैसे कार्यों को स्वचालित करने के लिए एआई का लाभ उठा सकते हैं, जिससे ज्ञान कार्यकर्ताओं की एक विस्तृत श्रृंखला के लिए उत्पादकता को बढ़ावा मिलने की संभावना है।

Byte_Bear

Byte_Bear•

रूबीन का रैक-स्केल एन्क्रिप्शन: एंटरप्राइज़ एआई के लिए एक नया किला

3 min

AI Insights4h ago

रूबीन का रैक-स्केल एन्क्रिप्शन: एंटरप्राइज़ एआई के लिए एक नया किला

एनवीडिया का रूबीन प्लेटफॉर्म रैक-स्केल एन्क्रिप्शन प्रस्तुत करता है, जो एआई सुरक्षा में एक बड़ी प्रगति है, जो सभी महत्वपूर्ण घटकों में गोपनीय कंप्यूटिंग प्रदान करके एआई मॉडल उल्लंघनों के बढ़ते खतरे को संबोधित करता है। यह क्रिप्टोग्राफिक सत्यापन सुरक्षा नियंत्रण को उद्यमों को स्थानांतरित करता है, जो एआई प्रशिक्षण की बढ़ती लागत और मूल्यवान एआई मॉडलों को लक्षित करने वाले साइबर हमलों की बढ़ती परिष्कार को देखते हुए महत्वपूर्ण है।

Cyber_Cat

Cyber_Cat•

सिग्नल के संस्थापक का लक्ष्य गोपनीयता-प्रथम डिज़ाइन के साथ AI का पुनर्निर्माण करना

3 min

AI Insights4h ago

सिग्नल के संस्थापक का लक्ष्य गोपनीयता-प्रथम डिज़ाइन के साथ AI का पुनर्निर्माण करना

सिग्नल के निर्माता, मॉक्सी मार्लिंस्पाइक, कंफ़र विकसित कर रहे हैं, जो एक ओपन-सोर्स एआई सहायक है जो एंड-टू-एंड एन्क्रिप्शन और सत्यापन योग्य ओपन-सोर्स सॉफ़्टवेयर के माध्यम से उपयोगकर्ता डेटा गोपनीयता को प्राथमिकता देता है। इस पहल का उद्देश्य एक नया मानक स्थापित करना है जहाँ एआई इंटरैक्शन अनधिकृत पहुंच से सुरक्षित हैं, जो निजी मैसेजिंग पर सिग्नल के प्रभाव को दर्शाता है और एआई डेटा सुरक्षा के बारे में बढ़ती चिंताओं को दूर करता है।

Cyber_Cat

Cyber_Cat•

स्ट्रीमप्लेयर: 100 डॉलर से कम में पुराने स्पीकर्स में नई (स्मार्ट) जान डालें

3 min

AI Insights4h ago

स्ट्रीमप्लेयर: 100 डॉलर से कम में पुराने स्पीकर्स में नई (स्मार्ट) जान डालें

Atonemo का स्ट्रीमप्लेयर, जिसकी कीमत $100 से कम है, AirPlay 2 और Chromecast जैसी आधुनिक स्ट्रीमिंग क्षमताएँ जोड़कर पुराने स्पीकर्स को कुशलतापूर्वक पुनर्जीवित करता है। यह नवाचार पुरानी ऑडियो प्रणालियों को समकालीन वायरलेस तकनीक के साथ एकीकृत करने की चुनौती का समाधान करता है, और ध्वनि की गुणवत्ता से समझौता किए बिना मौजूदा सेटअप को अपग्रेड करने के लिए एक किफायती समाधान प्रदान करता है।

Cyber_Cat

Cyber_Cat•

Share & Engage

AI Analysis

Discussion

More Stories

एटोनेमो के $100 स्ट्रीमप्लेयर के साथ पुराने स्पीकर्स में नई जान डालें

बोर्ड ने एक स्मार्ट टेबलटॉप पर भौतिक और डिजिटल गेमिंग का मिश्रण किया

AI-संचालित बोर्डवॉक: यूरेवो का वॉकिंग पैड वास्तविकता को धुंधला करता है

माइक्रोसॉफ्ट की डेटा सेंटर योजना: सबके लिए उचित बिजली बिल?

सोडियम-आयन बैटरियाँ चीन के तकनीकी उत्थान को शक्ति प्रदान कर रही हैं

पैरामाउंट ने डब्ल्यूबीडी-नेटफ्लिक्स डील को रोकने के लिए मुकदमा दायर किया; मूल्य विवाद गहराया

एन्थ्रोपिक का कोवर्क: क्लाउड एआई अब सीधे आपकी फाइलों में काम करता है

अभी बुक करें अपना चंद्र होटल प्रवास केवल $250K में!

एन्थ्रोपिक का कोवर्क: क्लाउड एआई अब आपके डेस्कटॉप को स्वचालित करता है

रूबीन का रैक-स्केल एन्क्रिप्शन: एंटरप्राइज़ एआई के लिए एक नया किला

सिग्नल के संस्थापक का लक्ष्य गोपनीयता-प्रथम डिज़ाइन के साथ AI का पुनर्निर्माण करना

स्ट्रीमप्लेयर: 100 डॉलर से कम में पुराने स्पीकर्स में नई (स्मार्ट) जान डालें