गूगल का आंतरिक आरएल: दीर्घ-क्षितिज एआई की ओर एक छलांग

गूगल के शोधकर्ताओं ने शायद AI की एक बड़ी चुनौती को हल कर लिया है। उन्होंने "आंतरिक RL" विकसित किया है, जो AI मॉडल को प्रशिक्षित करने की एक नई तकनीक है। यह सफलता लंबी अवधि के AI एजेंटों को अनलॉक कर सकती है। निष्कर्ष 16 जनवरी, 2026 को प्रकाशित किए गए थे।

आंतरिक RL एक मॉडल के आंतरिक कामकाज को निर्देशित करता है। यह AI को चरण-दर-चरण समस्या-समाधान की ओर मार्गदर्शन करता है। यह अगले-टोकन भविष्यवाणी की सीमाओं को दरकिनार करता है। वर्तमान LLM अक्सर जटिल तर्क के साथ संघर्ष करते हैं।

तत्काल प्रभाव महत्वपूर्ण हो सकता है। AI एजेंट अधिक स्वायत्त हो सकते हैं। वे निरंतर मानवीय देखरेख के बिना जटिल कार्यों को संभाल सकते हैं। इसका रोबोटिक्स और अन्य क्षेत्रों के लिए निहितार्थ है।

LLM पारंपरिक रूप से अगले-टोकन भविष्यवाणी के माध्यम से सीखते हैं। यह विधि दीर्घकालिक योजना के लिए अक्षम हो सकती है। आंतरिक RL एक अधिक प्रत्यक्ष दृष्टिकोण प्रदान करता है। यह उच्च-स्तरीय रणनीतियों को विकसित करने पर केंद्रित है।

अगले चरणों में आगे परीक्षण और परिशोधन शामिल हैं। शोधकर्ताओं का लक्ष्य तकनीक को बढ़ाना है। अंतिम लक्ष्य वास्तव में स्वायत्त AI एजेंटों का निर्माण करना है। यह AI के दुनिया के साथ बातचीत करने के तरीके में क्रांति ला सकता है।