বৃহৎ ভাষা মডেল (LLM) API-এর খরচ উল্লেখযোগ্যভাবে কমানো যেতে পারে সিমান্টিক ক্যাশিংয়ের মাধ্যমে, এমনটাই জানিয়েছেন শ্রীনিবাস রেড্ডি হুলেবেডু রেড্ডি, একজন মেশিন লার্নিং পেশাদার যিনি সম্প্রতি তার কোম্পানির LLM খরচ ৭৩% কমিয়েছেন। রেড্ডি লক্ষ্য করেন যে তার কোম্পানির LLM API বিল প্রতি মাসে ৩০% হারে বাড়ছে, যদিও সেই হারে ট্র্যাফিক বাড়েনি। কোয়েরি লগ বিশ্লেষণ করে দেখা যায় যে ব্যবহারকারীরা একই প্রশ্ন বিভিন্নভাবে করছেন, যার ফলে LLM-এ অতিরিক্ত কল করা হচ্ছে।
রেড্ডি দেখেন যে ব্যবহারকারীরা বিভিন্ন শব্দ ব্যবহার করে শব্দার্থগতভাবে অভিন্ন প্রশ্ন করছেন। উদাহরণস্বরূপ, "আপনাদের রিটার্ন পলিসি কী?", "আমি কীভাবে কিছু ফেরত দেব?", এবং "আমি কি রিফান্ড পেতে পারি?" এই ধরনের প্রশ্নগুলি LLM-এ আলাদা কল ট্রিগার করে, প্রতিটি প্রায় একই উত্তর তৈরি করে এবং সম্পূর্ণ API খরচ বহন করে। সনাতন, হুবহু-মিল ক্যাশিং, যা কোয়েরি টেক্সটকে ক্যাশ কী হিসাবে ব্যবহার করে, তা অকার্যকর প্রমাণিত হয়েছে, এই অতিরিক্ত কলগুলির মধ্যে মাত্র ১৮% ধরতে পেরেছে।
এই সমস্যা সমাধানের জন্য, রেড্ডি সিমান্টিক ক্যাশিং প্রয়োগ করেন, যা প্রশ্নের সঠিক শব্দচয়নের চেয়ে তাদের অর্থের উপর বেশি মনোযোগ দেয়। এই পদ্ধতির ফলে ক্যাশ হিট রেট ৬৭%-এ বেড়েছে, যার ফলে LLM API খরচ ৭৩% কমেছে। রেড্ডি ব্যাখ্যা করেন, "ব্যবহারকারীরা হুবহু একই শব্দে প্রশ্ন করেন না," যা হুবহু-মিল ক্যাশিংয়ের সীমাবদ্ধতা তুলে ধরে। তিনি সমস্যার গভীরতা বুঝতে ১,০০,০০০ প্রোডাকশন কোয়েরি বিশ্লেষণ করেন।
সিমান্টিক ক্যাশিং সনাতন ক্যাশিং পদ্ধতি থেকে একটি পরিবর্তন উপস্থাপন করে, যেখানে একটি প্রশ্নের অন্তর্নিহিত অর্থ বোঝার জন্য কৌশল ব্যবহার করা হয়। শুধুমাত্র কোয়েরির টেক্সট তুলনা করার পরিবর্তে, সিমান্টিক ক্যাশিং প্রশ্নের উদ্দেশ্য এবং প্রেক্ষাপট সনাক্ত করতে প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (NLP) এবং মেশিন লার্নিং মডেল ব্যবহার করে। এটি সিস্টেমকে বুঝতে সাহায্য করে যে "আপনাদের রিটার্ন পলিসি কী?" এবং "আমি কীভাবে কিছু ফেরত দেব?" মূলত একই জিনিস জিজ্ঞাসা করছে।
সিমান্টিক ক্যাশিংয়ের প্রভাব খরচ কমানোর বাইরেও বিস্তৃত। LLM API-তে কলের সংখ্যা কমিয়ে, এটি প্রতিক্রিয়ার সময়কে উন্নত করতে এবং সিস্টেমের সামগ্রিক লোড কমাতে পারে। এটি বিশেষভাবে সেই অ্যাপ্লিকেশনগুলির জন্য গুরুত্বপূর্ণ যা প্রচুর পরিমাণে ব্যবহারকারীর প্রশ্নের উত্তর দেয়। উপরন্তু, সিমান্টিক ক্যাশিং কম্পিউটেশনাল রিসোর্সের আরও দক্ষ ব্যবহারে অবদান রাখতে পারে, যা প্রযুক্তি শিল্পে বৃহত্তর স্থিতিশীলতার লক্ষ্যের সাথে সঙ্গতিপূর্ণ।
কার্যকর সিমান্টিক ক্যাশিং সিস্টেমের বিকাশের জন্য বেশ কয়েকটি বিষয় বিবেচনা করা প্রয়োজন, যার মধ্যে NLP মডেলের পছন্দ, ক্যাশ কী-এর নকশা এবং অস্পষ্ট বা জটিল প্রশ্নের মোকাবিলার কৌশল অন্যতম। রেড্ডির অভিজ্ঞতা সিমান্টিক ক্যাশিংয়ের সম্ভাব্য সুবিধা দেখালেও, তিনি আরও উল্লেখ করেছেন যে সর্বোত্তম ফলাফল অর্জনের জন্য এমন সমস্যাগুলি সমাধান করা প্রয়োজন যা সরল প্রয়োগের মাধ্যমে ধরা পরে না। নির্দিষ্ট চ্যালেঞ্জ এবং সমাধান অ্যাপ্লিকেশন এবং ব্যবহারকারীর প্রশ্নের বৈশিষ্ট্যের উপর নির্ভর করে পরিবর্তিত হবে।
Discussion
Join the conversation
Be the first to comment