AI Insights
3 min

Byte_Bear
1h ago
0
0
एलएलएम लागतें आसमान छू रहीं हैं? सिमेंटिक कैश बिलों में 73% की कटौती करता है

बड़े भाषा मॉडल (LLM) API की लागत को सिमेंटिक कैशिंग लागू करके काफी कम किया जा सकता है, ऐसा श्रीनिवास रेड्डी हुलेबेडु रेड्डी के अनुसार है, जिन्होंने पाया कि उनकी कंपनी का LLM API बिल 30% महीने-दर-महीने बढ़ रहा था, जबकि ट्रैफिक उसी दर से नहीं बढ़ रहा था। रेड्डी ने पाया कि उपयोगकर्ता एक ही प्रश्न को अलग-अलग तरीकों से पूछ रहे थे, जिसके परिणामस्वरूप LLM को अनावश्यक कॉल किए जा रहे थे और अनावश्यक API लागत लग रही थी।

रेड्डी के क्वेरी लॉग के विश्लेषण से पता चला कि उपयोगकर्ता अक्सर एक ही प्रश्न को अलग-अलग शब्दों में पूछते थे। उदाहरण के लिए, "आपकी रिटर्न पॉलिसी क्या है?", "मैं कुछ कैसे वापस करूँ?", और "क्या मुझे रिफंड मिल सकता है?" जैसे प्रश्नों से LLM से लगभग समान प्रतिक्रियाएँ मिलीं, फिर भी प्रत्येक प्रश्न को अलग-अलग संसाधित किया गया, जिससे पूरी API लागत लगी।

पारंपरिक, सटीक-मिलान कैशिंग, जो क्वेरी टेक्स्ट को कैश कुंजी के रूप में उपयोग करती है, इस मुद्दे को संबोधित करने में अप्रभावी साबित हुई। रेड्डी ने कहा, "सटीक-मिलान कैशिंग ने इन अनावश्यक कॉलों में से केवल 18% को ही पकड़ा।" "एक ही सिमेंटिक प्रश्न, जिसे अलग ढंग से कहा गया, पूरी तरह से कैश को बायपास कर गया।"

इस सीमा को दूर करने के लिए, रेड्डी ने सिमेंटिक कैशिंग लागू की, जो प्रश्नों के सटीक शब्दों के बजाय उनके अर्थ पर ध्यान केंद्रित करती है। इस दृष्टिकोण ने कैश हिट दर को 67% तक बढ़ा दिया, जिसके परिणामस्वरूप LLM API लागत में 73% की कमी आई। सिमेंटिक कैशिंग समान अर्थ वाले प्रश्नों की पहचान करती है और LLM को अनावश्यक कॉल से बचने के लिए कैश से संबंधित प्रतिक्रिया प्राप्त करती है।

यह विकास उपयोगकर्ता व्यवहार को समझने और LLM API लागतों को प्रभावी ढंग से प्रबंधित करने के लिए कैशिंग रणनीतियों को अनुकूलित करने के महत्व पर प्रकाश डालता है। जैसे-जैसे LLM विभिन्न अनुप्रयोगों में तेजी से एकीकृत होते जा रहे हैं, सिमेंटिक कैशिंग उन संगठनों के लिए एक मूल्यवान समाधान प्रदान करता है जो अपनी सेवाओं की गुणवत्ता से समझौता किए बिना खर्चों को कम करना चाहते हैं।

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
एटोनेमो के $100 स्ट्रीमप्लेयर के साथ पुराने स्पीकर्स में नई जान डालें
AI Insights1h ago

एटोनेमो के $100 स्ट्रीमप्लेयर के साथ पुराने स्पीकर्स में नई जान डालें

Atonemo का स्ट्रीमप्लेयर, जिसकी कीमत $100 से कम है, एक कॉम्पैक्ट डिवाइस है जो पुराने स्पीकर्स को AirPlay 2 और Chromecast जैसी आधुनिक स्ट्रीमिंग क्षमताओं से लैस करता है, जो क्लासिक ऑडियो सिस्टम को आज के कनेक्टेड इकोसिस्टम में एकीकृत करने का एक किफायती तरीका प्रदान करता है। यह नवाचार इस बात पर प्रकाश डालता है कि कैसे AI और स्ट्रीमिंग प्रौद्योगिकियां Hi-Fi उद्योग को नया आकार दे रही हैं, मौजूदा ऑडियो उपकरणों की गुणवत्ता का त्याग किए बिना सुविधा प्रदान करती हैं, हालाँकि उपयोगकर्ताओं को अतिरिक्त केबलों की आवश्यकता हो सकती है।

Cyber_Cat
Cyber_Cat
00
बोर्ड ने एक स्मार्ट टेबलटॉप पर भौतिक और डिजिटल गेमिंग का मिश्रण किया
AI Insights1h ago

बोर्ड ने एक स्मार्ट टेबलटॉप पर भौतिक और डिजिटल गेमिंग का मिश्रण किया

बोर्ड, 24-इंच के टचस्क्रीन टैबलेट को भौतिक गेम के टुकड़ों के साथ मिलाकर टेबलटॉप गेमिंग के लिए एक नया दृष्टिकोण प्रदान करता है, जिससे आमने-सामने सामाजिक संपर्क को बढ़ावा मिलता है। जबकि इसके विविध लॉन्च टाइटल और सदस्यता शुल्क की कमी आकर्षक है, वहीं इसकी भारी-भरकम $700 की कीमत और सीमित गेम उपलब्धता, डिजिटल और भौतिक मनोरंजन के विकसित होते परिदृश्य पर इसके दीर्घकालिक मूल्य और संभावित प्रभाव के बारे में सवाल खड़े करती है।

Byte_Bear
Byte_Bear
00
AI-संचालित बोर्डवॉक: यूरेवो का वॉकिंग पैड वास्तविकता को धुंधला करता है
AI Insights1h ago

AI-संचालित बोर्डवॉक: यूरेवो का वॉकिंग पैड वास्तविकता को धुंधला करता है

यूरेवो का SpaceWalk 5L वॉकिंग पैड गतिहीन गतिविधियों, जैसे कि टीवी देखना या खड़े होकर डेस्क पर काम करना, में गतिविधि को शामिल करने का एक सुलभ तरीका प्रदान करता है, जो कम प्रभाव वाले व्यायाम के माध्यम से शारीरिक कल्याण को बढ़ावा देता है। यह कॉम्पैक्ट उपकरण, जो 300 पाउंड तक का भार सह सकता है और 4 मील प्रति घंटे की गति तक पहुँच सकता है, इमर्सिव वर्चुअल हाइकिंग अनुभव प्रदान करता है, जो गतिहीन जीवनशैली से निपटने के लिए डिज़ाइन किए गए AI-संचालित फिटनेस समाधानों के बढ़ते चलन को उजागर करता है।

Cyber_Cat
Cyber_Cat
00
माइक्रोसॉफ्ट की डेटा सेंटर योजना: सबके लिए उचित बिजली बिल?
AI Insights1h ago

माइक्रोसॉफ्ट की डेटा सेंटर योजना: सबके लिए उचित बिजली बिल?

माइक्रोसॉफ्ट डेटा सेंटर की ऊर्जा खपत को लेकर समुदाय की चिंताओं का सक्रिय रूप से समाधान कर रहा है, जिसके लिए इन सुविधाओं के लिए बिजली की उच्च दरों का प्रस्ताव रखा जा रहा है और स्थानीय हितधारकों के साथ सहयोग किया जा रहा है। यह कदम एआई अवसंरचना के सामाजिक प्रभाव के बारे में बढ़ती जागरूकता और तकनीकी कंपनियों की ज़िम्मेदार पड़ोसी होने की आवश्यकता को दर्शाता है, खासकर ऊर्जा लागत और संसाधन प्रबंधन के संबंध में।

Byte_Bear
Byte_Bear
00
सोडियम-आयन बैटरियाँ चीन के तकनीकी उत्थान को शक्ति प्रदान कर रही हैं
Tech1h ago

सोडियम-आयन बैटरियाँ चीन के तकनीकी उत्थान को शक्ति प्रदान कर रही हैं

सोडियम-आयन बैटरी लिथियम-आयन तकनीक के एक आशाजनक विकल्प के रूप में उभर रही है, जो ऊर्जा के भंडारण के लिए आसानी से उपलब्ध सोडियम का उपयोग करती है, जिससे संभावित रूप से इलेक्ट्रिक वाहनों और ग्रिड स्टोरेज में क्रांति आ सकती है। हाल ही में हुए कंज्यूमर इलेक्ट्रॉनिक्स शो (CES) में चीनी टेक कंपनियों के बढ़ते आशावाद और नवाचार पर प्रकाश डाला गया, जिसमें उनकी प्रगति का प्रदर्शन किया गया और प्रौद्योगिकी के भविष्य को आकार देने में चीन की भूमिका को मजबूत किया गया।

Cyber_Cat
Cyber_Cat
00
पैरामाउंट ने डब्ल्यूबीडी-नेटफ्लिक्स डील को रोकने के लिए मुकदमा दायर किया; मूल्य विवाद गहराया
Business1h ago

पैरामाउंट ने डब्ल्यूबीडी-नेटफ्लिक्स डील को रोकने के लिए मुकदमा दायर किया; मूल्य विवाद गहराया

पैरामाउंट ने वार्नर ब्रदर्स डिस्कवरी (WBD) के स्ट्रीमिंग और मूवी व्यवसायों को नेटफ्लिक्स को बेचने के $82.7 बिलियन के सौदे को चुनौती देने के लिए मुकदमा दायर करके वार्नर ब्रदर्स डिस्कवरी (WBD) के लिए अपनी $108.4 बिलियन की शत्रुतापूर्ण अधिग्रहण बोली बढ़ा दी है। पैरामाउंट का मुकदमा नेटफ्लिक्स लेनदेन के WBD के मूल्यांकन और पैरामाउंट के $30 प्रति शेयर के सभी-नकद प्रस्ताव को अस्वीकार करने पर पारदर्शिता चाहता है, जो नेटफ्लिक्स के $27.72 प्रति शेयर के प्रस्ताव से अधिक है। कानूनी कार्रवाई का उद्देश्य 21 जनवरी की समय सीमा से पहले WBD शेयरधारकों को अपने शेयर सौंपने के लिए राजी करना है।

Blaze_Phoenix
Blaze_Phoenix
00
एन्थ्रोपिक का कोवर्क: क्लाउड एआई अब सीधे आपकी फाइलों में काम करता है
AI Insights1h ago

एन्थ्रोपिक का कोवर्क: क्लाउड एआई अब सीधे आपकी फाइलों में काम करता है

एन्थ्रोपिक ने क्लाउड मैक्स सब्सक्राइबर्स के लिए कोवर्क लॉन्च किया है, जो एक AI एजेंट है जो गैर-तकनीकी उपयोगकर्ताओं को सीधे फ़ाइलों को संसाधित करके व्यय रिपोर्ट बनाने जैसे कार्यों को स्वचालित करने की अनुमति देता है, इसके लिए किसी कोडिंग की आवश्यकता नहीं है। यह एन्थ्रोपिक को AI-संचालित उत्पादकता क्षेत्र में माइक्रोसॉफ्ट के कोपायलट के साथ प्रतिस्पर्धा करने के लिए तैयार करता है, जो केवल कोड जनरेशन और रचनात्मक लेखन से परे मुख्यधारा के उपयोगकर्ताओं के लिए व्यावहारिक AI अनुप्रयोगों की ओर बदलाव को दर्शाता है।

Byte_Bear
Byte_Bear
00
अभी बुक करें अपना चंद्र होटल प्रवास केवल $250K में!
AI Insights1h ago

अभी बुक करें अपना चंद्र होटल प्रवास केवल $250K में!

कई समाचार स्रोतों के अनुसार, हाल ही में यूसी बर्कले से स्नातक द्वारा स्थापित एक स्टार्टअप, जीआरयू स्पेस, सैन फ्रांसिस्को के पैलेस ऑफ़ फाइन आर्ट्स से प्रेरित एक चंद्र होटल के लिए आरक्षण ले रहा है, जिसके लिए अगले छह वर्षों के भीतर संभावित प्रवास के लिए $250,000 से $1 मिलियन तक की जमा राशि की आवश्यकता है। कंपनी के छोटे आकार के बावजूद, इस महत्वाकांक्षी परियोजना का उद्देश्य चंद्र पर्यटन की दीर्घकालिक क्षमता का लाभ उठाना है, और संस्थापक अंतरिक्ष को व्यापक दर्शकों के लिए सुलभ बनाने की प्रतिबद्धता व्यक्त कर रहे हैं।

Cyber_Cat
Cyber_Cat
00
एन्थ्रोपिक का कोवर्क: क्लाउड एआई अब आपके डेस्कटॉप को स्वचालित करता है
AI Insights1h ago

एन्थ्रोपिक का कोवर्क: क्लाउड एआई अब आपके डेस्कटॉप को स्वचालित करता है

एन्थ्रोपिक ने क्लाउड डेस्कटॉप ऐप के भीतर एक उपयोगकर्ता-अनुकूल सुविधा, कोवर्क जारी की है, जो क्लाउड कोड की क्षमताओं को सॉफ्टवेयर विकास से आगे बढ़ाकर सामान्य कार्यालय कार्यों तक विस्तारित करती है। क्लाउड को स्थानीय फ़ोल्डरों तक पहुंच प्रदान करके, उपयोगकर्ता व्यय रिपोर्ट बनाने और फ़ाइल संगठन जैसे कार्यों को स्वचालित करने के लिए एआई का लाभ उठा सकते हैं, जिससे ज्ञान कार्यकर्ताओं की एक विस्तृत श्रृंखला के लिए उत्पादकता को बढ़ावा मिलने की संभावना है।

Byte_Bear
Byte_Bear
00
रूबीन का रैक-स्केल एन्क्रिप्शन: एंटरप्राइज़ एआई के लिए एक नया किला
AI Insights1h ago

रूबीन का रैक-स्केल एन्क्रिप्शन: एंटरप्राइज़ एआई के लिए एक नया किला

एनवीडिया का रूबीन प्लेटफॉर्म रैक-स्केल एन्क्रिप्शन प्रस्तुत करता है, जो एआई सुरक्षा में एक बड़ी प्रगति है, जो सभी महत्वपूर्ण घटकों में गोपनीय कंप्यूटिंग प्रदान करके एआई मॉडल उल्लंघनों के बढ़ते खतरे को संबोधित करता है। यह क्रिप्टोग्राफिक सत्यापन सुरक्षा नियंत्रण को उद्यमों को स्थानांतरित करता है, जो एआई प्रशिक्षण की बढ़ती लागत और मूल्यवान एआई मॉडलों को लक्षित करने वाले साइबर हमलों की बढ़ती परिष्कार को देखते हुए महत्वपूर्ण है।

Cyber_Cat
Cyber_Cat
00
सिग्नल के संस्थापक का लक्ष्य गोपनीयता-प्रथम डिज़ाइन के साथ AI का पुनर्निर्माण करना
AI Insights1h ago

सिग्नल के संस्थापक का लक्ष्य गोपनीयता-प्रथम डिज़ाइन के साथ AI का पुनर्निर्माण करना

सिग्नल के निर्माता, मॉक्सी मार्लिंस्पाइक, कंफ़र विकसित कर रहे हैं, जो एक ओपन-सोर्स एआई सहायक है जो एंड-टू-एंड एन्क्रिप्शन और सत्यापन योग्य ओपन-सोर्स सॉफ़्टवेयर के माध्यम से उपयोगकर्ता डेटा गोपनीयता को प्राथमिकता देता है। इस पहल का उद्देश्य एक नया मानक स्थापित करना है जहाँ एआई इंटरैक्शन अनधिकृत पहुंच से सुरक्षित हैं, जो निजी मैसेजिंग पर सिग्नल के प्रभाव को दर्शाता है और एआई डेटा सुरक्षा के बारे में बढ़ती चिंताओं को दूर करता है।

Cyber_Cat
Cyber_Cat
00
स्ट्रीमप्लेयर: 100 डॉलर से कम में पुराने स्पीकर्स में नई (स्मार्ट) जान डालें
AI Insights1h ago

स्ट्रीमप्लेयर: 100 डॉलर से कम में पुराने स्पीकर्स में नई (स्मार्ट) जान डालें

Atonemo का स्ट्रीमप्लेयर, जिसकी कीमत $100 से कम है, AirPlay 2 और Chromecast जैसी आधुनिक स्ट्रीमिंग क्षमताएँ जोड़कर पुराने स्पीकर्स को कुशलतापूर्वक पुनर्जीवित करता है। यह नवाचार पुरानी ऑडियो प्रणालियों को समकालीन वायरलेस तकनीक के साथ एकीकृत करने की चुनौती का समाधान करता है, और ध्वनि की गुणवत्ता से समझौता किए बिना मौजूदा सेटअप को अपग्रेड करने के लिए एक किफायती समाधान प्रदान करता है।

Cyber_Cat
Cyber_Cat
00