गूगल के शोधकर्ताओं ने शायद AI की एक बड़ी चुनौती को हल कर लिया है। उन्होंने "आंतरिक RL" विकसित किया है, जो AI मॉडल को प्रशिक्षित करने की एक नई तकनीक है। यह सफलता लंबी अवधि के AI एजेंटों को अनलॉक कर सकती है। निष्कर्ष 16 जनवरी, 2026 को प्रकाशित किए गए थे।
आंतरिक RL एक मॉडल के आंतरिक कामकाज को निर्देशित करता है। यह AI को चरण-दर-चरण समस्या-समाधान की ओर मार्गदर्शन करता है। यह अगले-टोकन भविष्यवाणी की सीमाओं को दरकिनार करता है। वर्तमान LLM अक्सर जटिल तर्क के साथ संघर्ष करते हैं।
तत्काल प्रभाव महत्वपूर्ण हो सकता है। AI एजेंट अधिक स्वायत्त हो सकते हैं। वे निरंतर मानवीय देखरेख के बिना जटिल कार्यों को संभाल सकते हैं। इसका रोबोटिक्स और अन्य क्षेत्रों के लिए निहितार्थ है।
LLM पारंपरिक रूप से अगले-टोकन भविष्यवाणी के माध्यम से सीखते हैं। यह विधि दीर्घकालिक योजना के लिए अक्षम हो सकती है। आंतरिक RL एक अधिक प्रत्यक्ष दृष्टिकोण प्रदान करता है। यह उच्च-स्तरीय रणनीतियों को विकसित करने पर केंद्रित है।
अगले चरणों में आगे परीक्षण और परिशोधन शामिल हैं। शोधकर्ताओं का लक्ष्य तकनीक को बढ़ाना है। अंतिम लक्ष्य वास्तव में स्वायत्त AI एजेंटों का निर्माण करना है। यह AI के दुनिया के साथ बातचीत करने के तरीके में क्रांति ला सकता है।
Discussion
Join the conversation
Be the first to comment