গুগল-এর গবেষকেরা একটি নতুন এআই কৌশল উদ্ভাবন করেছেন, অভ্যন্তরীণ রিইনফোর্সমেন্ট লার্নিং (internal RL), যা দীর্ঘ-অনুভূমিক এআই এজেন্টদের ক্ষেত্রে বিপ্লব ঘটাতে পারে। ২০২৬ সালের ১৬ই জানুয়ারী ঘোষিত এই যুগান্তকারী আবিষ্কারটি বৃহৎ ভাষা মডেল (LLM)-গুলি জটিল যুক্তিতর্ক কীভাবে শেখে তার সীমাবদ্ধতাগুলি দূর করে। Internal RL একটি মডেলের অভ্যন্তরীণ প্রক্রিয়াগুলোকে ধাপে ধাপে সমস্যা সমাধানের দিকে পরিচালিত করে, পরবর্তী টোকেন পূর্বাভাসের উপর নির্ভর করার পরিবর্তে।
LLM-গুলিকে প্রশিক্ষণের বর্তমান পদ্ধতি প্রায়শই অলীক কল্পনা এবং জটিল কাজগুলিতে ব্যর্থতার দিকে পরিচালিত করে। রিইনফোর্সমেন্ট লার্নিং পোস্ট-ট্রেনিংয়ের জন্য অত্যন্ত গুরুত্বপূর্ণ, তবে LLM-এর অটো-রিগ্রেসিভ প্রকৃতি অনুসন্ধানের সুযোগ সীমিত করে। Internal RL মডেলের অভ্যন্তরীণ অ্যাক্টিভেশনগুলিকে গাইড করার মাধ্যমে একটি সম্ভাব্য সমাধান সরবরাহ করে।
এই উদ্ভাবনটি জটিল যুক্তিতর্ক এবং বাস্তব-বিশ্বের রোবোটিক্স পরিচালনা করতে সক্ষম স্বায়ত্তশাসিত এজেন্টদের জন্য পথ প্রশস্ত করতে পারে। এর মূল সুবিধা হল মানুষের তত্ত্বাবধানের প্রয়োজনীয়তা হ্রাস করা। এই উন্নয়ন আরও সক্ষম এবং স্বাধীন এআই সিস্টেমের দিকে একটি গুরুত্বপূর্ণ পদক্ষেপ।
ঐতিহ্যগতভাবে LLM একবারে একটি টোকেন তৈরি করে, যা বিভিন্ন কৌশল অন্বেষণ করা কঠিন করে তোলে। পরবর্তী পদক্ষেপগুলির মধ্যে রয়েছে বিভিন্ন অ্যাপ্লিকেশনের জন্য internal RL-এর পরীক্ষা এবং পরিমাপ বৃদ্ধি করা। এআই সম্প্রদায় আরও গবেষণা এবং বাস্তব-বিশ্বের প্রয়োগের প্রত্যাশা করছে।
Discussion
Join the conversation
Be the first to comment