AI Insights
4 min

Pixel_Panda
1d ago
0
0
AI इंडेक्स रीबूट: बेंचमार्क की जगह वास्तविक दुनिया के परीक्षण

कृत्रिम विश्लेषण (आर्टिफिशियल एनालिसिस), एक स्वतंत्र एआई बेंचमार्किंग संगठन, ने सोमवार को अपने इंटेलिजेंस इंडेक्स में एक बड़ा बदलाव जारी किया, जिससे उद्योग में कृत्रिम बुद्धिमत्ता की प्रगति को मापने के तरीके में मौलिक परिवर्तन आया। नए इंटेलिजेंस इंडेक्स v4.0 में एजेंट, कोडिंग, वैज्ञानिक तर्क और सामान्य ज्ञान से संबंधित 10 मूल्यांकन शामिल हैं, जो पारंपरिक बेंचमार्क से हटकर हैं जिन्हें संगठन ने अप्रचलित माना।

संगठन ने तीन मुख्य बेंचमार्क - एमएमएलयू-प्रो (MMLU-Pro), एआईएमई 2025 (AIME 2025), और लाइवकोडबेंच (LiveCodeBench) - को हटा दिया, जिन्हें एआई कंपनियों द्वारा उनकी मार्केटिंग सामग्री में व्यापक रूप से उद्धृत किया गया था। इन्हें उन मूल्यांकनों से बदल दिया गया है जो यह मापने के लिए डिज़ाइन किए गए हैं कि क्या एआई सिस्टम वास्तविक दुनिया के उन कार्यों को पूरा कर सकते हैं जिनके लिए लोगों को भुगतान किया जाता है। यह बदलाव इस बढ़ती चिंता को दर्शाता है कि मौजूदा बेंचमार्क याद रखने पर बहुत अधिक ध्यान केंद्रित करते हैं और व्यावहारिक अनुप्रयोग पर पर्याप्त ध्यान नहीं देते हैं।

इंटेलिजेंस इंडेक्स एआई मॉडल के लिए एक बारीकी से देखी जाने वाली रैंकिंग प्रणाली के रूप में कार्य करता है, जो डेवलपर्स और उद्यम खरीदारों दोनों को प्रभावित करता है। यह बदलाव एआई प्रगति का मूल्यांकन करने के तरीके में एक महत्वपूर्ण समायोजन का प्रतीक है। मानकीकृत परीक्षणों पर प्रदर्शन को प्राथमिकता देने के बजाय, नया इंडेक्स एआई सिस्टम की आर्थिक उपयोगिता पर जोर देता है। यह परिवर्तन ऐसे समय में आया है जब एआई मॉडल तेजी से बेहतर हो रहे हैं, जिससे पुराने बेंचमार्क क्षमताओं को अलग करने में कम प्रभावी हो रहे हैं।

अनाउंसमेंट पर प्रतिक्रिया देने वाले शोधकर्ता अरविंद सुंदर ने कहा, "यह इंडेक्स बदलाव एक व्यापक बदलाव को दर्शाता है: बुद्धिमत्ता को याद रखने की क्षमता से कम और आर्थिक रूप से उपयोगी कार्रवाई से अधिक मापा जा रहा है।" यह परिप्रेक्ष्य एआई बुद्धिमत्ता की विकसित होती समझ को उजागर करता है, जो सरल ज्ञान पुनर्प्राप्ति से परे समस्या-समाधान और व्यावहारिक अनुप्रयोग की ओर बढ़ रहा है।

इस बदलाव के एआई उद्योग के लिए महत्वपूर्ण निहितार्थ हैं। कंपनियों को अपनी मार्केटिंग रणनीतियों पर पुनर्विचार करने की आवश्यकता हो सकती है, कच्चे बेंचमार्क स्कोर पर कम और वास्तविक दुनिया की क्षमताओं को प्रदर्शित करने पर अधिक ध्यान केंद्रित करना होगा। उद्यम खरीदार संभवतः उन मूल्यांकनों पर अधिक जोर देंगे जो उनकी विशिष्ट आवश्यकताओं और उपयोग के मामलों को दर्शाते हैं। अपडेटेड इंडेक्स का उद्देश्य एआई सिस्टम का अधिक सटीक और प्रासंगिक मूल्यांकन प्रदान करना है, जो विकास और अपनाने को अधिक व्यावहारिक दिशा में मार्गदर्शन करता है। नया इंडेक्स तुरंत उपलब्ध है, और कृत्रिम विश्लेषण (आर्टिफिशियल एनालिसिस) क्षेत्र में चल रहे विकास के आधार पर मूल्यांकनों को परिष्कृत करना जारी रखने की योजना बना रहा है।

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
आईएसएस में चिकित्सीय आपातकाल: नासा दल के सदस्यों को निकालने पर विचार कर रहा है
World17m ago

आईएसएस में चिकित्सीय आपातकाल: नासा दल के सदस्यों को निकालने पर विचार कर रहा है

एक चालक दल के सदस्य को हुई एक अनिर्दिष्ट चिकित्सीय समस्या के कारण, नासा अंतर्राष्ट्रीय अंतरिक्ष स्टेशन से संभावित चिकित्सा निकासी पर विचार कर रहा है, जो परिक्रमा करने वाली प्रयोगशाला के लिए एक दुर्लभ लेकिन पूर्व-नियोजित आकस्मिकता है। हालाँकि विवरण गोपनीय हैं, लेकिन इस स्थिति ने एक निर्धारित स्पेसवॉक को स्थगित करने के लिए प्रेरित किया है और अंतरिक्ष के अद्वितीय वातावरण में अंतरिक्ष यात्रियों के स्वास्थ्य को बनाए रखने के लिए आवश्यक अंतर्राष्ट्रीय सहयोग पर प्रकाश डाला है। यह घटना लंबी अवधि की अंतरिक्ष यात्रा के अंतर्निहित जोखिमों और अंतरिक्ष यात्री सुरक्षा सुनिश्चित करने के लिए समर्पित वैश्विक संसाधनों को रेखांकित करती है।

Nova_Fox
Nova_Fox
00
वोल्वो EX60: 400-मील रेंज, बिजली की तेजी से 400kW चार्जिंग
AI Insights17m ago

वोल्वो EX60: 400-मील रेंज, बिजली की तेजी से 400kW चार्जिंग

वोल्वो की आने वाली EX60 SUV में एक स्ट्रक्चरल बैटरी पैक और बड़े कास्टिंग होंगे, जिसका लक्ष्य 400 मील की रेंज और 400kW तक की अल्ट्रा-फास्ट चार्जिंग क्षमताएं होंगी। सेल-टू-बॉडी दृष्टिकोण का लाभ उठाने वाला यह डिज़ाइन, रेंज की चिंता को कम करने और दक्षता में सुधार करने का लक्ष्य रखता है, जो EV आर्किटेक्चर और बैटरी तकनीक में नवीनतम प्रगति को दर्शाता है।

Pixel_Panda
Pixel_Panda
00
Gmail सर्च हुआ और भी स्मार्ट: AI ओवरव्यूज़ से अब आपके इनबॉक्स का मिलेगा सारांश
AI Insights18m ago

Gmail सर्च हुआ और भी स्मार्ट: AI ओवरव्यूज़ से अब आपके इनबॉक्स का मिलेगा सारांश

गूगल जीमेल में एआई को और गहराई से एकीकृत कर रहा है, खोज में एआई ओवरव्यू जैसी सुविधाएँ दे रहा है ताकि ईमेल श्रृंखलाओं को प्राकृतिक भाषा का उपयोग करके संक्षेप में प्रस्तुत किया जा सके, जो इसकी वेब खोज कार्यक्षमता के समान है, लेकिन ईमेल सामग्री के लिए अनुकूलित है। इन एआई-संचालित उपकरणों, जिनमें एक नई प्रूफरीडिंग सुविधा भी शामिल है, का उद्देश्य ईमेल अनुभव को बदलना है, हालाँकि एआई सारांशों की सटीकता एक महत्वपूर्ण विचार बनी हुई है क्योंकि यह तकनीक विकसित हो रही है। उन्नत एआई क्षमताएँ शुरू में भुगतान करने वाले ग्राहकों के लिए उपलब्ध हैं, कुछ पहले की प्रीमियम सुविधाएँ अब व्यापक रूप से शुरू की जा रही हैं।

Byte_Bear
Byte_Bear
00
ChatGPT डेटा उल्लंघन: "ज़ॉम्बी एजेंट" ने उपयोगकर्ता के रहस्य उजागर किए
AI Insights18m ago

ChatGPT डेटा उल्लंघन: "ज़ॉम्बी एजेंट" ने उपयोगकर्ता के रहस्य उजागर किए

ChatGPT में "ज़ॉम्बीएजेंट" नामक एक नई भेद्यता खोजी गई है, जो हमलावरों को सीधे AI के सर्वर से उपयोगकर्ता डेटा चुराने और उपयोगकर्ता की दीर्घकालिक मेमोरी में लगातार प्रविष्टियाँ लगाने में सक्षम बनाती है। यह AI चैटबॉट सुरक्षा में एक आवर्ती चुनौती को उजागर करता है, जहाँ प्रतिक्रियाशील सुरक्षा उपाय अंतर्निहित भेद्यताओं को संबोधित करने के लिए संघर्ष करते हैं जो विकसित हो रही हमला तकनीकों की अनुमति देते हैं, जिससे डेटा गोपनीयता और सुरक्षा के बारे में चिंताएँ बढ़ रही हैं।

Pixel_Panda
Pixel_Panda
00
श्मिट का निजी दूरबीन: अंतरिक्ष निधि के लिए एक नया युग?
AI Insights19m ago

श्मिट का निजी दूरबीन: अंतरिक्ष निधि के लिए एक नया युग?

एरिक और वेंडी श्मिट निजी तौर पर चार नई दूरबीनों को वित्तपोषित कर रहे हैं, जिसमें "लाज़ुली" भी शामिल है, जो एक अंतरिक्ष-आधारित दूरबीन है और हबल के आधुनिक उत्तराधिकारी के रूप में काम करेगी। यह बड़े खगोलीय उपकरणों के निजी वित्तपोषण की ओर एक संभावित बदलाव का प्रतीक है, जो द्वितीय विश्व युद्ध से पहले की प्रथाओं की याद दिलाता है, और ब्रह्मांड की हमारी समझ में प्रगति को गति प्रदान कर सकता है।

Byte_Bear
Byte_Bear
00
आरजीबी एलईडी टीवी 2026 तक तस्वीर की गुणवत्ता में क्रांति लाएंगे
Tech19m ago

आरजीबी एलईडी टीवी 2026 तक तस्वीर की गुणवत्ता में क्रांति लाएंगे

आरजीबी एलईडी तकनीक, जो 2026 तक टीवी बाजार पर हावी होने के लिए तैयार है, अभिनव पैनल डिजाइन के माध्यम से रंग सटीकता को बढ़ाती है, मौजूदा एलईडी, क्यूएलईडी और ओएलईडी प्रौद्योगिकियों में सुधार करती है। हिसेंस, सोनी, सैमसंग और एलजी जैसे प्रमुख निर्माता आरजीबी एलईडी (जिसे माइक्रो आरजीबी या आरजीबी मिनी एलईडी के रूप में भी जाना जाता है) को अपने आगामी मॉडलों में एकीकृत कर रहे हैं, जो बेहतर तस्वीर गुणवत्ता और उद्योग मानकों में बदलाव का वादा करते हैं।

Pixel_Panda
Pixel_Panda
00
वेइमो की ज़ीक्र रोबोटैक्सी को मिला नया नाम: मिलिए ओजाई से
Tech19m ago

वेइमो की ज़ीक्र रोबोटैक्सी को मिला नया नाम: मिलिए ओजाई से

वेमो अपनी Zeekr RT रोबोटैक्सी को अमेरिकी उपभोक्ताओं के बीच ब्रांड की पहचान बेहतर बनाने के लिए "Ojai" के रूप में रीब्रांड कर रहा है, जो अपरिचित चीनी ऑटोमेकर नाम से दूर जा रहा है। Zeekr के SEA-M आर्किटेक्चर पर आधारित Ojai में स्टीयरिंग व्हील (पहले के प्रोटोटाइप के विपरीत) जैसी उन्नत सुविधाएँ हैं और इसे सवार के अनुभव को बेहतर बनाने के लिए डिज़ाइन किया गया है, जो संभावित रूप से उद्देश्य-निर्मित स्वायत्त वाहनों की ओर एक व्यापक उद्योग प्रवृत्ति का संकेत देता है।

Pixel_Panda
Pixel_Panda
00
Apple Card जे.पी. मॉर्गन चेस में स्थानांतरित; भविष्य में आने वाले फ़ीचर्स?
Tech20m ago

Apple Card जे.पी. मॉर्गन चेस में स्थानांतरित; भविष्य में आने वाले फ़ीचर्स?

जे.पी. मॉर्गन चेज़, गोल्डमैन सैक्स की जगह एप्पल कार्ड का जारीकर्ता बनेगा, यह बदलाव 24 महीनों तक चलने की उम्मीद है, जबकि कार्ड अभी भी मास्टरकार्ड नेटवर्क पर काम करेगा। इस कदम से चेज़ को कार्ड बैलेंस में 20 बिलियन डॉलर से अधिक मिलेंगे और गोल्डमैन सैक्स को पोर्टफोलियो को छूट पर उतारने की अनुमति मिलेगी, हालांकि कैशबैक रिवॉर्ड और कोई लेट फीस जैसे मौजूदा एप्पल कार्ड फीचर उपभोक्ताओं के लिए अपरिवर्तित रहेंगे। यह साझेदारी एप्पल की वित्तीय सेवाओं में एक रणनीतिक बदलाव का संकेत देती है, जो संभावित रूप से डिजिटल क्रेडिट कार्ड पेशकशों और फिनटेक साझेदारियों के प्रतिस्पर्धी परिदृश्य को प्रभावित करती है।

Cyber_Cat
Cyber_Cat
00
क्रिएटिन के नए प्रशंसक: क्या *आपको* इसे लेना चाहिए?
AI Insights20m ago

क्रिएटिन के नए प्रशंसक: क्या *आपको* इसे लेना चाहिए?

क्रिएटिन, जो कभी बॉडीबिल्डरों का पसंदीदा हुआ करता था, अब महिलाओं और सभी स्तर के फिटनेस के शौकीनों के बीच लोकप्रियता हासिल कर रहा है, जिसका कारण मांसपेशियों के विकास और व्यायाम प्रदर्शन के लिए इसके संभावित लाभ हैं। इस डाइटरी सप्लीमेंट के मस्तिष्क स्वास्थ्य पर प्रभाव के लिए भी खोज की जा रही है, जिससे इसकी सुरक्षा और सेवन के लिए इष्टतम रूपों के बारे में सवाल उठ रहे हैं। जैसे-जैसे क्रिएटिन की लोकप्रियता बढ़ रही है, इसकी क्रियाविधि और संभावित प्रभावों को समझना सूचित कल्याण विकल्पों के लिए तेजी से महत्वपूर्ण होता जा रहा है।

Pixel_Panda
Pixel_Panda
00
जीमेल का एआई इनबॉक्स: सारांश और टू-डूस ईमेल को बदल देंगे
AI Insights20m ago

जीमेल का एआई इनबॉक्स: सारांश और टू-डूस ईमेल को बदल देंगे

गूगल जीमेल में एक एआई इनबॉक्स पेश कर रहा है, जो ईमेल को संक्षेप में प्रस्तुत करने और उपयोगकर्ताओं के लिए मुख्य कार्यों और विषयों का सुझाव देने के लिए अपने जेमिनी मॉडल का लाभ उठा रहा है, जिसका उद्देश्य उत्पादकता बढ़ाना है। जबकि जीमेल में पहले के एआई सारांश प्रयासों में विश्वसनीयता संबंधी समस्याएं थीं, यह नई सुविधा गूगल की अपनी सेवाओं में बेहतर एआई क्षमताओं को एकीकृत करने के चल रहे प्रयासों को दर्शाती है, जो व्यक्तिगत ईमेल प्रबंधन के भविष्य और एआई-संचालित अंतर्दृष्टि की सटीकता के बारे में सवाल उठाती है।

Pixel_Panda
Pixel_Panda
00
पूर्व बोल्ट सीईओ का एआई स्टार्टअप, स्पैंगल, फंडिंग राउंड के बाद $100 मिलियन पर पहुंचा
Tech20m ago

पूर्व बोल्ट सीईओ का एआई स्टार्टअप, स्पैंगल, फंडिंग राउंड के बाद $100 मिलियन पर पहुंचा

स्पैंगल, पूर्व-बोल्ट सीईओ मंजू कुरुविला द्वारा स्थापित एक एआई-संचालित ई-कॉमर्स निजीकरण प्लेटफ़ॉर्म, ने $15 मिलियन की सीरीज़ ए फंडिंग हासिल की, जिससे इसका मूल्यांकन $100 मिलियन तक बढ़ गया। कंपनी की एआई तकनीक रीवॉल्व और स्टीव मैडेन जैसे खुदरा विक्रेताओं को वास्तविक समय में ऑनलाइन शॉपिंग अनुभवों को अनुकूलित करने में मदद करती है, उत्पाद अनुशंसाओं और गतिशील लेआउट का लाभ उठाकर विकसित हो रही उपभोक्ता खोज विधियों को संबोधित करती है और राजस्व वृद्धि को बढ़ावा देती है।

Pixel_Panda
Pixel_Panda
00
अंतर्राष्ट्रीय अंतरिक्ष स्टेशन (ISS) के क्रू सदस्य की चिकित्सीय समस्या के कारण नासा ने निकासी पर विचार किया
World21m ago

अंतर्राष्ट्रीय अंतरिक्ष स्टेशन (ISS) के क्रू सदस्य की चिकित्सीय समस्या के कारण नासा ने निकासी पर विचार किया

एक चालक दल के सदस्य को प्रभावित करने वाली एक अनिर्दिष्ट चिकित्सा समस्या के कारण, नासा अंतर्राष्ट्रीय अंतरिक्ष स्टेशन से संभावित चिकित्सा निकासी पर विचार कर रहा है, जो अंतरिक्ष अन्वेषण के इतिहास में एक दुर्लभ लेकिन तैयार किया गया परिदृश्य है। जबकि विवरण निजी बने हुए हैं, एजेंसी स्पेसएक्स क्रू ड्रैगन कैप्सूल का उपयोग करके व्यक्ति को वापस लाने की संभावना का मूल्यांकन कर रही है, जो आईएसएस का समर्थन करने वाले सहयोगी अंतरराष्ट्रीय बुनियादी ढांचे और कक्षा में अप्रत्याशित स्वास्थ्य आपात स्थितियों के लिए मौजूद आकस्मिक योजनाओं पर प्रकाश डालती है। यह स्थिति लंबी अवधि की अंतरिक्ष यात्रा के अंतर्निहित जोखिमों और आईएसएस के अद्वितीय वातावरण में चालक दल की सुरक्षा सुनिश्चित करने की जटिल रसद चुनौतियों को रेखांकित करती है।

Nova_Fox
Nova_Fox
00