गूगल का "इंटरनल आरएल" लंबी दूरी की एआई रीजनिंग की ओर अग्रसर

गूगल के शोधकर्ताओं ने शायद एक बड़ी AI चुनौती को हल कर लिया है। उन्होंने "आंतरिक RL" विकसित किया है, जो AI मॉडल को प्रशिक्षित करने की एक नई तकनीक है। यह AI को जटिल तर्क सीखने में मदद करता है, जिससे सामान्य LLM कमियों से बचा जा सकता है। 16 जनवरी, 2026 को सामने आई इस सफलता से उन्नत AI एजेंटों का मार्ग प्रशस्त हो सकता है।

आंतरिक RL एक मॉडल के आंतरिक कामकाज को निर्देशित करता है। अगले शब्द की भविष्यवाणी करने के बजाय, यह चरण-दर-चरण समाधान बनाता है। यह AI को निरंतर मानवीय देखरेख के बिना जटिल कार्यों को संभालने की अनुमति देता है। टीम ने अगले-टोकन भविष्यवाणी की सीमाओं को दरकिनार कर दिया।

तत्काल प्रभाव बहुत बड़ा हो सकता है। विशेषज्ञों का मानना है कि इससे रोबोटिक्स और स्वायत्त प्रणालियों में क्रांति आ सकती है। यह विधि वास्तव में बुद्धिमान AI की ओर एक स्केलेबल मार्ग प्रदान करती है।

वर्तमान LLM लंबी अवधि की योजना बनाने में संघर्ष करते हैं। उनकी वास्तुकला, अगले टोकन की भविष्यवाणी पर आधारित होने के कारण, अन्वेषण को सीमित करती है। आंतरिक RL सुदृढीकरण सीखने के लिए एक नया दृष्टिकोण प्रदान करता है।

गूगल इस तकनीक को और परिष्कृत करने की योजना बना रहा है। ध्यान वास्तविक दुनिया के अनुप्रयोगों पर है। AI एजेंटों का भविष्य पहले से कहीं अधिक उज्ज्वल दिखता है।