MIT-এর কম্পিউটার বিজ্ঞান এবং কৃত্রিম বুদ্ধিমত্তা ল্যাবরেটরির (CSAIL) গবেষকরা একটি নতুন "পুনরাবৃত্তিমূলক" কাঠামো তৈরি করেছেন যা বৃহৎ ভাষা মডেলগুলিকে (LLM) ১ কোটি পর্যন্ত টোকেনযুক্ত প্রম্পটগুলি প্রক্রিয়া করতে দেয়, যা প্রসঙ্গ পচনের শিকার না হয়েই কাজ করতে পারে। প্রসঙ্গ পচন একটি সাধারণ সমস্যা, যা ইনপুট বাড়ার সাথে সাথে কর্মক্ষমতা কমিয়ে দেয়। এই উদ্ভাবনী পদ্ধতিটি, যা রিকার্সিভ ল্যাঙ্গুয়েজ মডেল (RLM) নামে পরিচিত, বিস্তৃত প্রম্পটটিকে একটি বাহ্যিক পরিবেশ হিসাবে বিবেচনা করে, যার সাথে LLM প্রোগ্রাম্যাটিকভাবে যোগাযোগ করতে পারে।
পুরো প্রম্পটটিকে মডেলের সীমিত কনটেক্সট উইন্ডোতে প্রবেশ করাতে বাধ্য করার পরিবর্তে, RLM কাঠামো LLM-কে পাঠ্যের ছোট, আরও পরিচালনাযোগ্য অংশে পরীক্ষা, বিভক্ত এবং পুনরাবৃত্তিমূলকভাবে নিজেকে কল করতে সক্ষম করে। এই পদ্ধতিটি দীর্ঘ-প্রসঙ্গ যুক্তিকে একটি সিস্টেম সমস্যা হিসাবে পুনরায় সংজ্ঞায়িত করে, যা মডেলগুলিকে কোড দিয়ে প্রম্পটগুলি পরিদর্শন করতে দেয়। MIT টিমের মতে, এটি LLM-কে পুনরায় প্রশিক্ষণ ছাড়াই লক্ষ লক্ষ টোকেনের উপর যুক্তি দিতে দেয়।
এই কাঠামোটি বিদ্যমান LLM-এর চারপাশে একটি আবরণের মতো কাজ করে, যা বর্তমানে এই মডেলগুলিতে সরাসরি কল করে এমন অ্যাপ্লিকেশনগুলির জন্য প্রতিস্থাপনের একটি সম্ভাব্য বিকল্প। এই সহজে একত্রিত করার বৈশিষ্ট্য বিভিন্ন শিল্পে এর ব্যবহারকে ত্বরান্বিত করতে পারে।
এই উদ্ভাবনটি কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে একটি গুরুত্বপূর্ণ চ্যালেঞ্জ মোকাবিলা করে: "LLM কনটেক্সট সমস্যা"। উন্নত মডেলগুলি যুক্তির ক্ষেত্রে ক্রমবর্ধমান পরিশীলিততা প্রদর্শন করলেও, বিপুল পরিমাণে তথ্য প্রক্রিয়াকরণের ক্ষমতা সীমিত থাকে। ঐতিহ্যবাহী পদ্ধতিগুলির মধ্যে কনটেক্সট উইন্ডো প্রসারিত করা বা পুরানো তথ্য সংক্ষিপ্ত করা অন্তর্ভুক্ত, তবে এই পদ্ধতিগুলি প্রায়শই অপর্যাপ্ত প্রমাণিত হয় বা ভুল তথ্য দেয়।
MIT-এর গবেষকরা মনে করেন যে RLMs দীর্ঘ-মেয়াদী কাজের জন্য আরও বাস্তবসম্মত সমাধান দেয় যা প্রায়শই বর্তমান মডেলগুলিকে অভিভূত করে। এই ধরনের কাজের উদাহরণগুলির মধ্যে রয়েছে ব্যাপক কোডবেস বিশ্লেষণ, গভীর আইনি পর্যালোচনা এবং জটিল বহু-পদক্ষেপ যুক্তিবিন্যাস প্রক্রিয়া। LLM-কে কার্যকরভাবে এই কাজগুলি পরিচালনা করতে সক্ষম করার মাধ্যমে, এই কাঠামোতে বিভিন্ন পেশাদার ক্ষেত্রে উৎপাদনশীলতা এবং সিদ্ধান্ত গ্রহণকে উল্লেখযোগ্যভাবে বাড়ানোর সম্ভাবনা রয়েছে।
এই প্রযুক্তির প্রভাব তাৎক্ষণিক ব্যবহারিক প্রয়োগের বাইরেও বিস্তৃত। কনটেক্সট উইন্ডোগুলির সীমাবদ্ধতাগুলি অতিক্রম করে, RLMs আরও অত্যাধুনিক AI সিস্টেমের পথ প্রশস্ত করতে পারে যা জটিল, দীর্ঘমেয়াদী প্রকল্প এবং বিশ্লেষণগুলি পরিচালনা করতে সক্ষম। এটি বৈজ্ঞানিক গবেষণা, আর্থিক মডেলিং এবং কৌশলগত পরিকল্পনার মতো ক্ষেত্রগুলিতে উন্নতির দিকে পরিচালিত করতে পারে।
MIT টিম বর্তমানে RLM কাঠামোর আরও অ্যাপ্লিকেশন অন্বেষণ করছে এবং এর কর্মক্ষমতা অপ্টিমাইজ করার জন্য কাজ করছে। তারা আশা করছেন যে এই প্রযুক্তি AI-এর ভবিষ্যতের উন্নয়নে একটি গুরুত্বপূর্ণ ভূমিকা পালন করবে, যা মডেলগুলিকে ক্রমবর্ধমান জটিল এবং চাহিদাপূর্ণ কাজগুলি মোকাবেলা করতে সক্ষম করবে। এই গবেষণাটি কেবল মডেলের আকার বাড়ানোর পরিবর্তে তথ্য প্রক্রিয়াকরণের জন্য আরও বুদ্ধিমান এবং দক্ষ পদ্ধতি বিকাশের দিকে মনোযোগ সরানোর বিষয়টিকে তুলে ধরে।
Discussion
Join the conversation
Be the first to comment