গুগলের গবেষকেরা "অভ্যন্তরীণ আরএল" নামের একটি নতুন এআই কৌশল তৈরি করেছেন, যা দীর্ঘ-অনুভূমিক এআই এজেন্টদের ক্ষেত্রে বিপ্লব ঘটাতে পারে। ২০২৬ সালের ১৬ই জানুয়ারি ঘোষিত এই যুগান্তকারী আবিষ্কারটি এআই মডেলগুলি জটিল যুক্তিতর্ক কীভাবে শেখে তার সীমাবদ্ধতাগুলি দূর করে। অভ্যন্তরীণ আরএল একটি মডেলের অভ্যন্তরীণ প্রক্রিয়াগুলিকে ধাপে ধাপে সমাধানের দিকে পরিচালিত করে। এটি পরবর্তী টোকেন পূর্বাভাসের ঐতিহ্যবাহী পদ্ধতিকে এড়িয়ে যায়, যা প্রায়শই ত্রুটির দিকে পরিচালিত করে।
পরবর্তী টোকেন পূর্বাভাসের সমস্যা হল এটি মডেলগুলিকে পরবর্তী একক টোকেন বা অ্যাকশনে ছোট, এলোমেলো পরিবর্তন করে নতুন কৌশল অন্বেষণ করতে বাধ্য করে। এর ফলে এআই-এর জন্য জটিল যুক্তিতর্কের কাজগুলি শেখা কঠিন হয়ে পড়ে, যেগুলির জন্য দীর্ঘ-অনুভূমিক পরিকল্পনা প্রয়োজন।
এর তাৎক্ষণিক প্রভাব হতে পারে স্বায়ত্তশাসিত এজেন্টদের জন্য একটি পরিমাপযোগ্য পথ। এই এজেন্টরা জটিল যুক্তিতর্ক এবং বাস্তব-বিশ্বের রোবোটিক্স পরিচালনা করতে সক্ষম হবে। সম্ভবত ধ্রুবক ম্যানুয়াল নির্দেশনার প্রয়োজন হবে না।
বর্তমান এলএলএমগুলি অটোরেগ্রেসিভ। এগুলি একবারে একটি করে টোকেন তৈরি করে। এই মডেলগুলির পোস্ট-ট্রেনিংয়ের জন্য রিইনফোর্সমেন্ট লার্নিং অত্যন্ত গুরুত্বপূর্ণ। তবে, এই মডেলগুলির আর্কিটেকচার তাদের ক্ষমতাকে সীমিত করে।
পরবর্তী পদক্ষেপগুলিতে আরও জটিল পরিবেশে অভ্যন্তরীণ আরএল পরীক্ষা করা জড়িত। গবেষকরা বাস্তব-বিশ্বের অ্যাপ্লিকেশনগুলির জন্য কৌশলটিকে আরও পরিমার্জিত করার লক্ষ্য রেখেছেন। এটি এআই স্বায়ত্তশাসনের ক্ষেত্রে উল্লেখযোগ্য অগ্রগতি আনতে পারে।
Discussion
Join the conversation
Be the first to comment