गूगल के शोधकर्ताओं ने एक ऐसी सफलता हासिल की है जो AI में क्रांति ला सकती है। उन्होंने "आंतरिक RL" विकसित किया है, जो एक ऐसी तकनीक है जो AI मॉडल को जटिल तर्क सीखने की अनुमति देती है। यह उन्नति पारंपरिक नेक्स्ट-टोकन प्रेडिक्शन की सीमाओं को दरकिनार करती है। गूगल की AI लैब्स में किया गया यह शोध 16 जनवरी, 2026 को सामने आया।
आंतरिक RL एक मॉडल की आंतरिक प्रक्रियाओं को निर्देशित करता है। यह AI को चरण-दर-चरण समाधानों की ओर मार्गदर्शन करता है। यह दृष्टिकोण AI को उन कार्यों को संभालने की अनुमति देता है जो आमतौर पर बड़े भाषा मॉडल को विफल कर देते हैं। वर्तमान LLM अक्सर मतिभ्रम करते हैं या दीर्घकालिक योजना बनाने में संघर्ष करते हैं।
तत्काल प्रभाव AI एजेंटों की एक नई पीढ़ी हो सकती है। ये एजेंट जटिल तर्क कर सकते हैं और वास्तविक दुनिया के रोबोट को नियंत्रित कर सकते हैं। इससे निरंतर मानवीय देखरेख की आवश्यकता कम हो जाएगी। विशेषज्ञों का मानना है कि यह स्वायत्त AI के लिए एक स्केलेबल मार्ग हो सकता है।
LLM वर्तमान में ऑटोरेग्रेसिव मॉडल पर निर्भर करते हैं। ये मॉडल एक बार में एक टोकन के क्रम उत्पन्न करते हैं। इन मॉडलों को परिष्कृत करने के लिए रीइन्फोर्समेंट लर्निंग का उपयोग किया जाता है। हालाँकि, नेक्स्ट-टोकन प्रेडिक्शन नई रणनीतियों का पता लगाने की उनकी क्षमता को सीमित करता है।
गूगल की योजना आंतरिक RL को और विकसित और परीक्षण करने की है। इसका ध्यान इसकी क्षमताओं और वास्तविक दुनिया के अनुप्रयोगों का विस्तार करने पर होगा। रोबोटिक्स, ऑटोमेशन और AI सुरक्षा के लिए इसके निहितार्थ महत्वपूर्ण हैं।
Discussion
Join the conversation
Be the first to comment