गूगल के शोधकर्ताओं ने शायद एक बड़ी AI चुनौती को पार कर लिया है। उनकी नई तकनीक, "इंटरनल RL," लंबी अवधि के AI एजेंटों को अनलॉक कर सकती है। 16 जनवरी, 2026 को घोषित यह सफलता, AI मॉडल के जटिल तर्क सीखने के तरीके में सीमाओं को संबोधित करती है।
इंटरनल RL एक मॉडल के आंतरिक कामकाज को निर्देशित करता है। यह AI को चरण-दर-चरण समाधानों की ओर मार्गदर्शन करता है। यह अगले-टोकन भविष्यवाणी की पारंपरिक विधि को दरकिनार करता है। वह विधि अक्सर AI "भ्रम" और विफलताओं की ओर ले जाती है।
तत्काल प्रभाव बहुत बड़ा हो सकता है। विशेषज्ञों का मानना है कि यह स्वायत्त एजेंटों का मार्ग प्रदान करता है। ये एजेंट जटिल कार्यों और वास्तविक दुनिया के रोबोटिक्स को संभाल सकते हैं। कम मानव मार्गदर्शन की आवश्यकता होगी।
वर्तमान LLM ऑटोरेग्रेसिव हैं। वे टोकन द्वारा टोकन अनुक्रम उत्पन्न करते हैं। इससे नई रणनीतियों का पता लगाना मुश्किल हो जाता है। इंटरनल RL एक संभावित समाधान प्रदान करता है।
अगले चरणों में तकनीक को बढ़ाना और परीक्षण करना शामिल है। ध्यान वास्तविक दुनिया के अनुप्रयोगों पर है। AI समुदाय बारीकी से देख रहा है। यह AI विकास में क्रांति ला सकता है।
Discussion
Join the conversation
Be the first to comment