गूगल के शोधकर्ताओं ने एक नई एआई तकनीक, आंतरिक रीइन्फोर्समेंट लर्निंग (आंतरिक आरएल) विकसित की है, जो लंबी अवधि के एआई एजेंटों में क्रांति ला सकती है। 16 जनवरी, 2026 को घोषित यह सफलता, एआई मॉडल के जटिल तर्क सीखने के तरीके में सीमाओं को संबोधित करती है। आंतरिक आरएल एक मॉडल की आंतरिक प्रक्रियाओं को चरण-दर-चरण समस्या-समाधान की ओर ले जाता है। यह अगले-टोकन भविष्यवाणी की पारंपरिक विधि को दरकिनार करता है, जिससे अक्सर त्रुटियां होती हैं।
अगले-टोकन भविष्यवाणी के साथ समस्या यह है कि एलएलएम एक समय में एक टोकन अनुक्रम उत्पन्न करते हैं। इससे प्रशिक्षण के दौरान मॉडल के लिए नई रणनीतियों का पता लगाना मुश्किल हो जाता है। आंतरिक आरएल स्वायत्त एजेंट बनाने के लिए एक स्केलेबल मार्ग प्रदान करता है। ये एजेंट जटिल तर्क और वास्तविक दुनिया के रोबोटिक्स को संभाल सकते हैं।
तत्काल प्रभाव एआई की लगातार मानवीय देखरेख के बिना जटिल कार्यों को करने की क्षमता में देखा जा सकता है। विशेषज्ञों का मानना है कि इससे अधिक कुशल और विश्वसनीय एआई सिस्टम बन सकते हैं।
वर्तमान में, रीइन्फोर्समेंट लर्निंग का उपयोग जटिल तर्क के लिए एलएलएम को प्रशिक्षित करने के लिए किया जाता है। हालांकि, इन मॉडलों की वास्तुकला प्रभावी ढंग से योजना बनाने की उनकी क्षमता को सीमित करती है।
अगले चरणों में वास्तविक दुनिया के अनुप्रयोगों में आंतरिक आरएल का परीक्षण शामिल है। शोधकर्ताओं का लक्ष्य तकनीक को परिष्कृत करना और विभिन्न एआई कार्यों के लिए इसकी क्षमता का पता लगाना है। यह विकास अधिक सक्षम और स्वायत्त एआई एजेंटों के भविष्य का वादा करता है।
Discussion
Join the conversation
Be the first to comment