অনেক কোম্পানি লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম) এপিআই ব্যবহারের জন্য অপ্রত্যাশিতভাবে বেশি বিলের সম্মুখীন হচ্ছে, যার কারণে তারা সাশ্রয়ী সমাধানের সন্ধান করছে। শ্রীনিবাস রেড্ডি হুলেবেডু রেড্ডি, সম্প্রতি কোয়েরি লগ বিশ্লেষণের মাধ্যমে জানতে পেরেছেন যে, এলএলএম খরচের একটি উল্লেখযোগ্য অংশ ব্যবহারকারীদের একই প্রশ্ন ভিন্নভাবে করার কারণে হয়েছে।
রেড্ডি দেখেন যে, তার কোম্পানির এলএলএম এপিআই-এর ট্র্যাফিক বাড়লেও, খরচ প্রতি মাসে ৩০% হারে বাড়ছে, যা বহন করা কঠিন। তিনি ব্যাখ্যা করেন যে, ব্যবহারকারীরা শব্দার্থগতভাবে একই ধরনের কোয়েরি করছেন, যেমন "আপনাদের রিটার্ন পলিসি কী?", "আমি কীভাবে কিছু ফেরত দিতে পারি?", এবং "আমি কি রিফান্ড পেতে পারি?", যেগুলোকে এলএলএম প্রতিটি স্বতন্ত্র অনুরোধ হিসেবে প্রক্রিয়া করছে, যার ফলে প্রতিটিতে সম্পূর্ণ এপিআই খরচ লাগছে।
ঐতিহ্যবাহী, হুবহু-মিল ক্যাশিং, যা কোয়েরি টেক্সটকে ক্যাশ কী হিসেবে ব্যবহার করে, এই সমস্যা সমাধানে অকার্যকর প্রমাণিত হয়েছে। রেড্ডি উল্লেখ করেন, "হুবহু-মিল ক্যাশিং এই ধরনের অপ্রয়োজনীয় কলের মধ্যে মাত্র ১৮টি ধরতে পেরেছে। একই শব্দার্থের প্রশ্ন, ভিন্নভাবে করা হলে, ক্যাশকে সম্পূর্ণভাবে এড়িয়ে যায়।"
এই সমস্যা মোকাবেলার জন্য, রেড্ডি শব্দার্থিক ক্যাশিং প্রয়োগ করেন, যা কোয়েরিগুলোর হুবহু শব্দের পরিবর্তে তাদের অর্থের উপর মনোযোগ দেয়। এই পদ্ধতি ক্যাশ হিট রেট-এর উল্লেখযোগ্য উন্নতি ঘটায়, যা ৬৭%-এ পৌঁছায় এবং শেষ পর্যন্ত এলএলএম এপিআই খরচ ৭৩% কমায়।
শব্দার্থিক ক্যাশিং, হুবহু-মিল ক্যাশিংয়ের সীমাবদ্ধতাগুলো ব্যবহারকারীর কোয়েরির পেছনের উদ্দেশ্য বোঝার মাধ্যমে সমাধান করে। শুধুমাত্র কোয়েরির টেক্সট তুলনা করার পরিবর্তে, শব্দার্থিক ক্যাশিং এমবেডিং বা শব্দার্থিক সাদৃশ্য অ্যালগরিদমের মতো কৌশল ব্যবহার করে এটা নির্ধারণ করে যে অনুরূপ প্রশ্নের উত্তর আগে দেওয়া হয়েছে কিনা। যদি ক্যাশে শব্দার্থিকভাবে অনুরূপ কোনো কোয়েরি থাকে, তাহলে সিস্টেম ক্যাশ করা উত্তরটি পুনরুদ্ধার করতে পারে, যার ফলে এলএলএম-কে আবার কল করার প্রয়োজন হয় না।
এলএলএম এপিআই খরচের বৃদ্ধি, ব্যবসায়িক ক্ষেত্রে এআই সংহত করার ক্ষেত্রে একটি ক্রমবর্ধমান উদ্বেগের কারণ। এলএলএম যত বেশি প্রচলিত হবে, তাদের ব্যবহার অপ্টিমাইজ করা এবং খরচ কমানো ততটাই গুরুত্বপূর্ণ হয়ে উঠবে। শব্দার্থিক ক্যাশিং এই চ্যালেঞ্জ মোকাবেলার জন্য একটি আশাব্যঞ্জক পদ্ধতি, তবে রেড্ডি যেমন উল্লেখ করেছেন, এর সফল বাস্তবায়নের জন্য ভাষা এবং ব্যবহারকারীর আচরণের সূক্ষ্ম বিষয়গুলো বিবেচনা করা প্রয়োজন।
Discussion
Join the conversation
Be the first to comment