गूगल के शोधकर्ताओं ने एक नई एआई तकनीक, आंतरिक रीइन्फोर्समेंट लर्निंग (internal reinforcement learning या आंतरिक आरएल) विकसित की है। यह अधिक सक्षम एआई एजेंटों के लिए मार्ग प्रशस्त कर सकती है। 16 जनवरी, 2026 को घोषित यह सफलता, इस बात की सीमाओं को संबोधित करती है कि एलएलएम जटिल तर्क कैसे सीखते हैं।
आंतरिक आरएल एक मॉडल की आंतरिक प्रक्रियाओं का मार्गदर्शन करता है। यह इसे चरण-दर-चरण समाधान विकसित करने में मदद करता है। वर्तमान एलएलएम अपने टोकन-दर-टोकन जनरेशन के कारण लंबी अवधि की योजना बनाने में संघर्ष करते हैं। यह नई विधि निरंतर मानवीय निरीक्षण की आवश्यकता को दरकिनार कर देती है।
तत्काल प्रभाव रोबोटिक्स और स्वायत्त प्रणालियों में देखा जा सकता है। विशेषज्ञों का मानना है कि यह प्रगति एआई को जन्म देगी जो जटिल कार्यों को अधिक स्वतंत्र रूप से संभाल सकती है। यह विकास नेक्स्ट-टोकन प्रेडिक्शन से परे एक महत्वपूर्ण कदम है।
एलएलएम को आमतौर पर नेक्स्ट-टोकन प्रेडिक्शन का उपयोग करके प्रशिक्षित किया जाता है। यह विधि मॉडल को छोटे, यादृच्छिक परिवर्तन करने के लिए मजबूर करती है। आंतरिक आरएल जटिल समस्या-समाधान के लिए अधिक प्रत्यक्ष दृष्टिकोण प्रदान करता है।
शोधकर्ताओं की वास्तविक दुनिया के परिदृश्यों में अनुप्रयोगों का पता लगाने की योजना है। व्यापक उपयोग के लिए प्रौद्योगिकी को बढ़ाने पर ध्यान केंद्रित किया जाएगा। यह विभिन्न उद्योगों में एआई की भूमिका में क्रांति ला सकता है।
Discussion
Join the conversation
Be the first to comment