गूगल के शोधकर्ताओं ने एक ऐसी सफलता हासिल की है जो AI में क्रांति ला सकती है। उन्होंने "आंतरिक RL" विकसित किया है, एक ऐसी तकनीक जो AI मॉडल को मतिभ्रम की सामान्य कमियों के बिना जटिल तर्क सीखने की अनुमति देती है। यह नवाचार, 16 जनवरी, 2026 को सामने आया, उन्नत AI एजेंट बनाने का मार्ग प्रदान करता है।
आंतरिक RL एक मॉडल के आंतरिक कामकाज को चरण-दर-चरण समस्या-समाधान की ओर ले जाता है। यह पारंपरिक तरीकों के विपरीत है जो एक क्रम में अगले शब्द की भविष्यवाणी करने पर निर्भर करते हैं। वर्तमान दृष्टिकोण AI की प्रभावी ढंग से आगे की योजना बनाने की क्षमता को सीमित करता है। सुदृढीकरण सीखना LLM के पोस्ट-ट्रेनिंग के लिए महत्वपूर्ण है, खासकर उन कार्यों के लिए जिनमें दीर्घकालिक योजना की आवश्यकता होती है।
तत्काल प्रभाव स्वायत्त प्रणालियों में देखा जा सकता है। विशेषज्ञों का मानना है कि इससे AI एजेंट जटिल कार्यों और वास्तविक दुनिया की रोबोटिक्स को संभालने में सक्षम हो सकते हैं। यह उन्नति निरंतर मानवीय निरीक्षण की आवश्यकता को कम करती है।
वर्तमान LLM अपनी वास्तुकला के कारण जटिल तर्क के साथ संघर्ष करते हैं। वे टोकन द्वारा टोकन अनुक्रम उत्पन्न करते हैं, जिससे नई रणनीतियों का पता लगाने की उनकी क्षमता सीमित हो जाती है। आंतरिक RL मॉडल की आंतरिक स्थिति पर ध्यान केंद्रित करके इस सीमा को दूर करता है।
गूगल की आंतरिक RL को और परिष्कृत करने की योजना है। अगला कदम विभिन्न अनुप्रयोगों में इसकी क्षमता का पता लगाना शामिल है। यह जटिल निर्णय लेने की आवश्यकता वाले क्षेत्रों में AI के लिए नई संभावनाओं को खोल सकता है।
Discussion
Join the conversation
Be the first to comment