গুগলের গবেষকেরা একটি যুগান্তকারী সাফল্য অর্জন করেছেন যা এআই-এর ক্ষেত্রে বিপ্লব ঘটাতে পারে। তাঁরা "অভ্যন্তরীণ আরএল" (internal RL) তৈরি করেছেন, এমন একটি কৌশল যা এআই মডেলগুলোকে হ্যালুসিনেশনের সাধারণ ফাঁদগুলো এড়িয়ে জটিল যুক্তি শিখতে দেয়। ২০২৬ সালের ১৬ই জানুয়ারি প্রকাশিত এই উদ্ভাবনটি উন্নত এআই এজেন্ট তৈরির একটি পথ খুলে দেয়।
অভ্যন্তরীণ আরএল একটি মডেলের অভ্যন্তরীণ কার্যক্রমকে ধাপে ধাপে সমস্যা সমাধানের দিকে পরিচালিত করে। এটি গতানুগতিক পদ্ধতির বিপরীতে কাজ করে, যেখানে একটি অনুক্রমে পরবর্তী শব্দটি কী হবে তা অনুমান করার ওপর নির্ভর করা হয়। বর্তমান পদ্ধতি কার্যকরভাবে আগে থেকে পরিকল্পনা করার ক্ষেত্রে এআই-এর ক্ষমতাকে সীমিত করে। রিইনফোর্সমেন্ট লার্নিং এলএলএম (LLM)-গুলোকে পোস্ট-ট্রেনিংয়ের জন্য গুরুত্বপূর্ণ, বিশেষ করে দীর্ঘমেয়াদী পরিকল্পনার প্রয়োজন হয় এমন কাজের জন্য।
এর তাৎক্ষণিক প্রভাব স্বয়ংক্রিয় সিস্টেমে দেখা যেতে পারে। বিশেষজ্ঞদের ধারণা, এটি এমন এআই এজেন্ট তৈরি করতে পারে যা জটিল কাজ এবং বাস্তব-বিশ্বের রোবোটিক্স সামলাতে সক্ষম। এই অগ্রগতিতে মানুষের কাছ থেকে ক্রমাগত তদারকির প্রয়োজনীয়তা হ্রাস পায়।
বর্তমান এলএলএমগুলো তাদের কাঠামোর কারণে জটিল যুক্তির সঙ্গে লড়াই করে। তারা টোকেন বাই টোকেন সিকোয়েন্স তৈরি করে, যা নতুন কৌশল অনুসন্ধানের ক্ষমতাকে সীমিত করে। অভ্যন্তরীণ আরএল মডেলের অভ্যন্তরীণ অবস্থার ওপর মনোযোগ কেন্দ্রীভূত করে এই সীমাবদ্ধতা কাটিয়ে ওঠে।
গুগল অভ্যন্তরীণ আরএলকে আরও পরিমার্জন করার পরিকল্পনা করছে। পরবর্তী ধাপে বিভিন্ন অ্যাপ্লিকেশনে এর সম্ভাবনা অনুসন্ধান করা হবে। এর মাধ্যমে জটিল সিদ্ধান্ত গ্রহণের প্রয়োজন হয় এমন ক্ষেত্রগুলোতে এআই-এর জন্য নতুন সম্ভাবনা উন্মোচিত হতে পারে।
Discussion
Join the conversation
Be the first to comment