कृत्रिम विश्लेषण (आर्टिफिशियल एनालिसिस), एक स्वतंत्र एआई बेंचमार्किंग संगठन, ने सोमवार को अपने इंटेलिजेंस इंडेक्स में एक बड़ा बदलाव जारी किया, जिससे उद्योग में कृत्रिम बुद्धिमत्ता की प्रगति को मापने के तरीके में मौलिक परिवर्तन आया। नए इंटेलिजेंस इंडेक्स v4.0 में एजेंट, कोडिंग, वैज्ञानिक तर्क और सामान्य ज्ञान से संबंधित 10 मूल्यांकन शामिल हैं, जो पारंपरिक बेंचमार्क से हटकर हैं जिन्हें संगठन ने अप्रचलित माना।
संगठन ने तीन मुख्य बेंचमार्क - एमएमएलयू-प्रो (MMLU-Pro), एआईएमई 2025 (AIME 2025), और लाइवकोडबेंच (LiveCodeBench) - को हटा दिया, जिन्हें एआई कंपनियों द्वारा उनकी मार्केटिंग सामग्री में व्यापक रूप से उद्धृत किया गया था। इन्हें उन मूल्यांकनों से बदल दिया गया है जो यह मापने के लिए डिज़ाइन किए गए हैं कि क्या एआई सिस्टम वास्तविक दुनिया के उन कार्यों को पूरा कर सकते हैं जिनके लिए लोगों को भुगतान किया जाता है। यह बदलाव इस बढ़ती चिंता को दर्शाता है कि मौजूदा बेंचमार्क याद रखने पर बहुत अधिक ध्यान केंद्रित करते हैं और व्यावहारिक अनुप्रयोग पर पर्याप्त ध्यान नहीं देते हैं।
इंटेलिजेंस इंडेक्स एआई मॉडल के लिए एक बारीकी से देखी जाने वाली रैंकिंग प्रणाली के रूप में कार्य करता है, जो डेवलपर्स और उद्यम खरीदारों दोनों को प्रभावित करता है। यह बदलाव एआई प्रगति का मूल्यांकन करने के तरीके में एक महत्वपूर्ण समायोजन का प्रतीक है। मानकीकृत परीक्षणों पर प्रदर्शन को प्राथमिकता देने के बजाय, नया इंडेक्स एआई सिस्टम की आर्थिक उपयोगिता पर जोर देता है। यह परिवर्तन ऐसे समय में आया है जब एआई मॉडल तेजी से बेहतर हो रहे हैं, जिससे पुराने बेंचमार्क क्षमताओं को अलग करने में कम प्रभावी हो रहे हैं।
अनाउंसमेंट पर प्रतिक्रिया देने वाले शोधकर्ता अरविंद सुंदर ने कहा, "यह इंडेक्स बदलाव एक व्यापक बदलाव को दर्शाता है: बुद्धिमत्ता को याद रखने की क्षमता से कम और आर्थिक रूप से उपयोगी कार्रवाई से अधिक मापा जा रहा है।" यह परिप्रेक्ष्य एआई बुद्धिमत्ता की विकसित होती समझ को उजागर करता है, जो सरल ज्ञान पुनर्प्राप्ति से परे समस्या-समाधान और व्यावहारिक अनुप्रयोग की ओर बढ़ रहा है।
इस बदलाव के एआई उद्योग के लिए महत्वपूर्ण निहितार्थ हैं। कंपनियों को अपनी मार्केटिंग रणनीतियों पर पुनर्विचार करने की आवश्यकता हो सकती है, कच्चे बेंचमार्क स्कोर पर कम और वास्तविक दुनिया की क्षमताओं को प्रदर्शित करने पर अधिक ध्यान केंद्रित करना होगा। उद्यम खरीदार संभवतः उन मूल्यांकनों पर अधिक जोर देंगे जो उनकी विशिष्ट आवश्यकताओं और उपयोग के मामलों को दर्शाते हैं। अपडेटेड इंडेक्स का उद्देश्य एआई सिस्टम का अधिक सटीक और प्रासंगिक मूल्यांकन प्रदान करना है, जो विकास और अपनाने को अधिक व्यावहारिक दिशा में मार्गदर्शन करता है। नया इंडेक्स तुरंत उपलब्ध है, और कृत्रिम विश्लेषण (आर्टिफिशियल एनालिसिस) क्षेत्र में चल रहे विकास के आधार पर मूल्यांकनों को परिष्कृत करना जारी रखने की योजना बना रहा है।
Discussion
Join the conversation
Be the first to comment