गूगल के शोधकर्ताओं ने शायद एक बड़ी AI चुनौती को हल कर लिया है। उन्होंने "आंतरिक RL" विकसित किया है, जो AI मॉडल को प्रशिक्षित करने की एक नई तकनीक है। यह AI को जटिल तर्क सीखने में मदद करता है, जिससे सामान्य LLM कमियों से बचा जा सकता है। 16 जनवरी, 2026 को सामने आई इस सफलता से उन्नत AI एजेंटों का मार्ग प्रशस्त हो सकता है।
आंतरिक RL एक मॉडल के आंतरिक कामकाज को निर्देशित करता है। अगले शब्द की भविष्यवाणी करने के बजाय, यह चरण-दर-चरण समाधान बनाता है। यह AI को निरंतर मानवीय देखरेख के बिना जटिल कार्यों को संभालने की अनुमति देता है। टीम ने अगले-टोकन भविष्यवाणी की सीमाओं को दरकिनार कर दिया।
तत्काल प्रभाव बहुत बड़ा हो सकता है। विशेषज्ञों का मानना है कि इससे रोबोटिक्स और स्वायत्त प्रणालियों में क्रांति आ सकती है। यह विधि वास्तव में बुद्धिमान AI की ओर एक स्केलेबल मार्ग प्रदान करती है।
वर्तमान LLM लंबी अवधि की योजना बनाने में संघर्ष करते हैं। उनकी वास्तुकला, अगले टोकन की भविष्यवाणी पर आधारित होने के कारण, अन्वेषण को सीमित करती है। आंतरिक RL सुदृढीकरण सीखने के लिए एक नया दृष्टिकोण प्रदान करता है।
गूगल इस तकनीक को और परिष्कृत करने की योजना बना रहा है। ध्यान वास्तविक दुनिया के अनुप्रयोगों पर है। AI एजेंटों का भविष्य पहले से कहीं अधिक उज्ज्वल दिखता है।
Discussion
Join the conversation
Be the first to comment