অনেক কোম্পানি লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম) এপিআই ব্যবহারের জন্য অপ্রত্যাশিতভাবে বেশি বিলের সম্মুখীন হচ্ছে, যার ফলে সাশ্রয়ী সমাধানের খোঁজ চলছে। শ্রীনিবাস রেড্ডি হুলেবেডু রেড্ডি, ২০২৬ সালের ১০ই জানুয়ারি লিখেছেন, এলএলএম এপিআই-এর খরচ প্রতি মাসে ৩০% হারে বাড়ছে, যদিও সেই হারে ট্র্যাফিক বাড়েনি। রেড্ডি আবিষ্কার করেছেন যে ব্যবহারকারীরা একই প্রশ্ন বিভিন্নভাবে করছেন, যার ফলে এলএলএম-এ অতিরিক্ত কল যাচ্ছে।
রেড্ডি দেখেছেন যে সনাতন, হুবহু-মিল ক্যাশিং, যা ক্যাশে কী হিসাবে ক্যোয়ারী টেক্সট ব্যবহার করে, ১,০০,০০০ প্রোডাকশন ক্যোয়ারীর মধ্যে মাত্র ১৮টি অতিরিক্ত কল ধরতে পেরেছে। এর কারণ হল ব্যবহারকারীরা ভিন্নভাবে প্রশ্ন করেন, এমনকি অন্তর্নিহিত উদ্দেশ্য একই থাকলেও। উদাহরণস্বরূপ, "আপনার রিটার্ন পলিসি কী?", "আমি কীভাবে কিছু ফেরত দেব?", এবং "আমি কি রিফান্ড পেতে পারি?" এই প্রশ্নগুলো এলএলএম থেকে প্রায় একই রকম উত্তর পায় কিন্তু এগুলোকে স্বতন্ত্র অনুরোধ হিসাবে গণ্য করা হয়।
এই সমস্যা সমাধানের জন্য, রেড্ডি শব্দগত অর্থের উপর ভিত্তি করে ক্যাশিং (semantic caching) প্রয়োগ করেছেন, যা সঠিক শব্দ চয়নের পরিবর্তে প্রশ্নের অর্থের উপর মনোযোগ দেয়। এই পদ্ধতির ফলে ক্যাশে হিট রেট ৬৭% বেড়েছে, যার ফলে এলএলএম এপিআই-এর খরচ ৭৩% কমেছে। শব্দগত অর্থের উপর ভিত্তি করে ক্যাশিং একটি প্রশ্নের অন্তর্নিহিত উদ্দেশ্য সনাক্ত করে এবং ক্যাশে থেকে সেই অনুযায়ী সাড়া পুনরুদ্ধার করে, এমনকি যদি প্রশ্নটি ভিন্নভাবে করা হয় তবুও।
এলএলএম এপিআই-এর খরচ বৃদ্ধি পাওয়ায় ব্যবসাগুলি তাদের কর্মপ্রবাহে এআই সংহত করার ক্ষেত্রে একটি ক্রমবর্ধমান উদ্বেগের কারণ হয়ে দাঁড়িয়েছে। যেহেতু এলএলএম বিভিন্ন অ্যাপ্লিকেশনে, যেমন গ্রাহক পরিষেবা চ্যাটবট থেকে শুরু করে কন্টেন্ট তৈরির সরঞ্জাম পর্যন্ত আরও বেশি প্রচলিত হচ্ছে, তাই API কলের ক্রমবর্ধমান খরচ দ্রুত যথেষ্ট পরিমাণে বাড়তে পারে। এর ফলে শব্দগত অর্থের উপর ভিত্তি করে ক্যাশিংয়ের মতো অপ্টিমাইজেশন কৌশলগুলির প্রতি আগ্রহ বেড়েছে।
এলএলএম-এর প্রেক্ষাপটে শব্দগত অর্থের উপর ভিত্তি করে ক্যাশিং সনাতন ক্যাশিং পদ্ধতির তুলনায় একটি উল্লেখযোগ্য অগ্রগতি। যেখানে হুবহু-মিল ক্যাশিং অভিন্ন ক্যোয়ারী স্ট্রিংগুলির উপর নির্ভর করে, সেখানে শব্দগত অর্থের উপর ভিত্তি করে ক্যাশিং একই অর্থ আছে এমন ক্যোয়ারী সনাক্ত করতে স্বাভাবিক ভাষা বোঝা এবং শব্দগত মিলের মতো কৌশল ব্যবহার করে। এটি অনেক বেশি ক্যাশে হিট রেটের জন্য অনুমতি দেয় এবং ফলস্বরূপ, API খরচ কমায়।
শব্দগত অর্থের উপর ভিত্তি করে ক্যাশিং বাস্তবায়ন তার নিজস্ব চ্যালেঞ্জ ছাড়া নয়। ক্যোয়ারীগুলির মধ্যে শব্দগত মিল সঠিকভাবে নির্ধারণ করার জন্য অত্যাধুনিক অ্যালগরিদম প্রয়োজন। সরল প্রয়োগের ফলে ভুল ক্যাশে হিট হতে পারে, ব্যবহারকারীদের কাছে অপ্রাসঙ্গিক প্রতিক্রিয়া ফেরত যেতে পারে। তবে, সতর্কতার সাথে ডিজাইন এবং অপ্টিমাইজেশনের মাধ্যমে, শব্দগত অর্থের উপর ভিত্তি করে ক্যাশিং এলএলএম-চালিত অ্যাপ্লিকেশনগুলির গুণমানকে প্রভাবিত না করে যথেষ্ট খরচ সাশ্রয় করতে পারে।
Discussion
Join the conversation
Be the first to comment