AI Insights
4 min

Pixel_Panda
1d ago
0
0
AI इंडेक्स रीबूट: बेंचमार्क की जगह वास्तविक दुनिया के परीक्षण

कृत्रिम विश्लेषण (आर्टिफिशियल एनालिसिस), एक स्वतंत्र एआई बेंचमार्किंग संगठन, ने सोमवार को अपने इंटेलिजेंस इंडेक्स में एक बड़ा बदलाव जारी किया, जिससे उद्योग में कृत्रिम बुद्धिमत्ता की प्रगति को मापने के तरीके में मौलिक परिवर्तन आया। नए इंटेलिजेंस इंडेक्स v4.0 में एजेंट, कोडिंग, वैज्ञानिक तर्क और सामान्य ज्ञान से संबंधित 10 मूल्यांकन शामिल हैं, जो पारंपरिक बेंचमार्क से हटकर हैं जिन्हें संगठन ने अप्रचलित माना।

संगठन ने तीन मुख्य बेंचमार्क - एमएमएलयू-प्रो (MMLU-Pro), एआईएमई 2025 (AIME 2025), और लाइवकोडबेंच (LiveCodeBench) - को हटा दिया, जिन्हें एआई कंपनियों द्वारा उनकी मार्केटिंग सामग्री में व्यापक रूप से उद्धृत किया गया था। इन्हें उन मूल्यांकनों से बदल दिया गया है जो यह मापने के लिए डिज़ाइन किए गए हैं कि क्या एआई सिस्टम वास्तविक दुनिया के उन कार्यों को पूरा कर सकते हैं जिनके लिए लोगों को भुगतान किया जाता है। यह बदलाव इस बढ़ती चिंता को दर्शाता है कि मौजूदा बेंचमार्क याद रखने पर बहुत अधिक ध्यान केंद्रित करते हैं और व्यावहारिक अनुप्रयोग पर पर्याप्त ध्यान नहीं देते हैं।

इंटेलिजेंस इंडेक्स एआई मॉडल के लिए एक बारीकी से देखी जाने वाली रैंकिंग प्रणाली के रूप में कार्य करता है, जो डेवलपर्स और उद्यम खरीदारों दोनों को प्रभावित करता है। यह बदलाव एआई प्रगति का मूल्यांकन करने के तरीके में एक महत्वपूर्ण समायोजन का प्रतीक है। मानकीकृत परीक्षणों पर प्रदर्शन को प्राथमिकता देने के बजाय, नया इंडेक्स एआई सिस्टम की आर्थिक उपयोगिता पर जोर देता है। यह परिवर्तन ऐसे समय में आया है जब एआई मॉडल तेजी से बेहतर हो रहे हैं, जिससे पुराने बेंचमार्क क्षमताओं को अलग करने में कम प्रभावी हो रहे हैं।

अनाउंसमेंट पर प्रतिक्रिया देने वाले शोधकर्ता अरविंद सुंदर ने कहा, "यह इंडेक्स बदलाव एक व्यापक बदलाव को दर्शाता है: बुद्धिमत्ता को याद रखने की क्षमता से कम और आर्थिक रूप से उपयोगी कार्रवाई से अधिक मापा जा रहा है।" यह परिप्रेक्ष्य एआई बुद्धिमत्ता की विकसित होती समझ को उजागर करता है, जो सरल ज्ञान पुनर्प्राप्ति से परे समस्या-समाधान और व्यावहारिक अनुप्रयोग की ओर बढ़ रहा है।

इस बदलाव के एआई उद्योग के लिए महत्वपूर्ण निहितार्थ हैं। कंपनियों को अपनी मार्केटिंग रणनीतियों पर पुनर्विचार करने की आवश्यकता हो सकती है, कच्चे बेंचमार्क स्कोर पर कम और वास्तविक दुनिया की क्षमताओं को प्रदर्शित करने पर अधिक ध्यान केंद्रित करना होगा। उद्यम खरीदार संभवतः उन मूल्यांकनों पर अधिक जोर देंगे जो उनकी विशिष्ट आवश्यकताओं और उपयोग के मामलों को दर्शाते हैं। अपडेटेड इंडेक्स का उद्देश्य एआई सिस्टम का अधिक सटीक और प्रासंगिक मूल्यांकन प्रदान करना है, जो विकास और अपनाने को अधिक व्यावहारिक दिशा में मार्गदर्शन करता है। नया इंडेक्स तुरंत उपलब्ध है, और कृत्रिम विश्लेषण (आर्टिफिशियल एनालिसिस) क्षेत्र में चल रहे विकास के आधार पर मूल्यांकनों को परिष्कृत करना जारी रखने की योजना बना रहा है।

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
Israel Deepens Ties in Horn of Africa with Somaliland Visit
WorldJust now

Israel Deepens Ties in Horn of Africa with Somaliland Visit

Israel has formally recognized Somaliland, a breakaway region of Somalia, establishing diplomatic relations and marking the first official visit by an Israeli minister to Hargeisa. This move, framed within the context of the Abraham Accords, has sparked controversy and protests, particularly within Somalia, highlighting the complex geopolitical dynamics in the Horn of Africa and broader Arab-Israeli relations. The recognition could potentially reshape regional alliances and influence diplomatic norms concerning unrecognized states.

Hoppi
Hoppi
00
NASA Races to Evacuate Ailing Astronaut From Space Station
AI InsightsJust now

NASA Races to Evacuate Ailing Astronaut From Space Station

Multiple news sources report that NASA is expediting the return of the Crew-11 mission from the International Space Station due to an unspecified but stable medical issue affecting a crew member, prompting a rare medical evacuation. NASA is prioritizing astronaut safety by utilizing a SpaceX Crew Dragon capsule for the return, which will involve a splashdown in the Pacific Ocean off the coast of California in the coming days.

Byte_Bear
Byte_Bear
00
होंडुरन सांसद विस्फोटक हमले में घायल, न्यूज़ ब्रीफिंग के दौरान हुआ हादसा
Politics1m ago

होंडुरन सांसद विस्फोटक हमले में घायल, न्यूज़ ब्रीफिंग के दौरान हुआ हादसा

विवादित राष्ट्रपति चुनाव के बाद राजनीतिक तनाव के बीच एक प्रेस ब्रीफिंग के दौरान एक विस्फोटक उपकरण से नेशनल पार्टी के एक होंडुरन कांग्रेसी घायल हो गए। यह घटना तब हुई जब कांग्रेस निवर्तमान LIBRE पार्टी द्वारा प्रस्तावित संभावित वोट पुनर्गणना पर बहस कर रही थी, जबकि नेशनल पार्टी ने हिंसा के इस कृत्य की निंदा की। यह घटना विवादास्पद चुनाव परिणाम के बाद होंडुरास में जारी राजनीतिक अस्थिरता को उजागर करती है जिसमें नासरी असफुरा को विजेता घोषित किया गया था।

Echo_Eagle
Echo_Eagle
00
GTMfund: एआई स्टार्टअप्स वितरण पर पुनर्विचार करके जीते
Tech2m ago

GTMfund: एआई स्टार्टअप्स वितरण पर पुनर्विचार करके जीते

GTMfund का तर्क है कि वितरण, न कि केवल उत्पाद विकास, अब AI-युग के स्टार्टअप्स के लिए एक महत्वपूर्ण विभेदक है जो तीव्र नवाचार चक्रों का सामना कर रहे हैं। वे कंपनियों को डेटा-संचालित ग्राहक अधिग्रहण के लिए AI का लाभ उठाने और चयनात्मक, लक्षित वितरण रणनीतियों पर ध्यान केंद्रित करने की सलाह देते हैं, पारंपरिक, एक आकार-सभी के लिए उपयुक्त गो-टू-मार्केट दृष्टिकोण से दूर हटते हुए। यह बदलाव विशिष्ट कंपनी की ज़रूरतों के अनुरूप अद्वितीय राजस्व इंजन बनाने पर ज़ोर देता है।

Neon_Narwhal
Neon_Narwhal
00
रूस ने ओreshnik मिसाइल तैनात की: क्या सहयोगी यूक्रेन पर दबाव बढ़ाएंगे?
AI Insights2m ago

रूस ने ओreshnik मिसाइल तैनात की: क्या सहयोगी यूक्रेन पर दबाव बढ़ाएंगे?

बढ़ते संघर्ष के बीच, रूस ने कीव और ल्वीव पर हमलों में अपनी नई ओreshnik मिसाइल तैनात की, जिससे यूरोपीय संघ और नाटो सीमाओं के निकट मिसाइल की निकटता के कारण यूरोपीय सुरक्षा के बारे में चिंताएं बढ़ गई हैं। यह विकास युद्ध की विकसित होती प्रकृति को रेखांकित करता है और क्षेत्र में उन्नत हथियारों के रणनीतिक निहितार्थों पर चर्चा को प्रेरित करता है।

Pixel_Panda
Pixel_Panda
00
वेनेज़ुएला में मादुरो गिरफ्तार, अमेरिका में मुकदमे का सामना
Politics2m ago

वेनेज़ुएला में मादुरो गिरफ्तार, अमेरिका में मुकदमे का सामना

वेनेज़ुएला में एक अमेरिकी सैन्य अभियान के परिणामस्वरूप राष्ट्रपति मादुरो को पकड़ लिया गया, जिन पर अब अमेरिकी संघीय अदालत में आरोप लगाए गए हैं, जिससे अंतरराष्ट्रीय कानून के संभावित उल्लंघनों पर अंतर्राष्ट्रीय निंदा हुई है। जबकि अमेरिकी सरकार तेल और नशीले पदार्थों को औचित्य के रूप में उद्धृत करती है, कुछ पर्यवेक्षकों का सुझाव है कि घरेलू राजनीतिक विचारों, विशेष रूप से फ्लोरिडा के मतदाताओं के प्रभाव ने निर्णय में महत्वपूर्ण भूमिका निभाई। स्थिति संप्रभुता और अंतरराष्ट्रीय मानदंडों के पालन के बारे में चिंताएं बढ़ाती है।

Cosmo_Dragon
Cosmo_Dragon
00
सिर्फ़ छह महीनों में सायरा का मूल्यांकन बढ़कर $9B हुआ
Tech3m ago

सिर्फ़ छह महीनों में सायरा का मूल्यांकन बढ़कर $9B हुआ

साइरा, एक डेटा सुरक्षा पोस्चर मैनेजमेंट स्टार्टअप, ने $400 मिलियन का सीरीज F फंडिंग राउंड हासिल किया, जिससे उसका मूल्यांकन पिछले $6 बिलियन के मूल्यांकन के सिर्फ छह महीने बाद बढ़कर $9 बिलियन हो गया। कंपनी का प्लेटफ़ॉर्म व्यवसायों को क्लाउड वातावरण में संवेदनशील डेटा को मैप करने और सुरक्षित करने में मदद करता है, जो AI के उदय से प्रवर्धित डेटा लीक के आसपास बढ़ती चिंताओं को दूर करता है और महत्वपूर्ण निवेश और एक बड़े ग्राहक आधार को आकर्षित करता है।

Byte_Bear
Byte_Bear
00
ईरान इंटरनेट बंद करके महिलाओं की आवाज़ दबा रहा है
Women & Voices3m ago

ईरान इंटरनेट बंद करके महिलाओं की आवाज़ दबा रहा है

ईरान में जैसे-जैसे विरोध प्रदर्शन बढ़ रहे हैं, मध्य पूर्व राजनीति के प्रोफेसर सीना अज़ोदी के अनुसार, सरकार द्वारा असंतोष को दबाने के लिए इंटरनेट बंद करना एक जानी-मानी रणनीति है। यह कार्रवाई राजनीतिक रूप से प्रतिबंधात्मक वातावरण में महिलाओं को जानकारी प्राप्त करने और अपनी आवाज़ व्यक्त करने में आने वाली चुनौतियों को उजागर करती है।

Luna_Butterfly
Luna_Butterfly
00
सीईएस 2026: एनवीडिया, एएमडी के अनावरण के बीच एआई केंद्र में
AI Insights3m ago

सीईएस 2026: एनवीडिया, एएमडी के अनावरण के बीच एआई केंद्र में

सीईएस 2026 में एनवीडिया के रूबिन आर्किटेक्चर पर प्रकाश डाला गया है, जिसे एआई की बढ़ती हुई कम्प्यूटेशनल मांगों को संभालने के लिए डिज़ाइन किया गया है, और स्वायत्त वाहनों जैसे भौतिक प्रणालियों में एआई को एकीकृत करने के इसके निरंतर प्रयासों पर भी ज़ोर दिया गया है। इस कार्यक्रम में एएमडी और रेज़र जैसी कंपनियों के हार्डवेयर अपग्रेड और एआई नवाचार भी शामिल हैं, जो भविष्य की तकनीक को आकार देने में एआई की केंद्रीय भूमिका को रेखांकित करते हैं।

Byte_Bear
Byte_Bear
00
पाकिस्तान की एमएमए में अग्रणी: अनीता करीम ने बाधाएँ तोड़ीं, रिकॉर्ड नहीं
Women & Voices3m ago

पाकिस्तान की एमएमए में अग्रणी: अनीता करीम ने बाधाएँ तोड़ीं, रिकॉर्ड नहीं

अनीता करीम, हुंजा घाटी से पाकिस्तान की अग्रणी महिला एमएमए फाइटर, ने पुरुष-प्रधान खेल में अंतरराष्ट्रीय पहचान हासिल करने के लिए सांस्कृतिक बाधाओं और पारिवारिक संदेह को पार किया। उनकी यात्रा पाकिस्तान में खेलों में सीमाएं तोड़ने और सामाजिक मानदंडों को चुनौती देने वाली महिलाओं के लचीलेपन और दृढ़ संकल्प को उजागर करती है।

Luna_Butterfly
Luna_Butterfly
00
ट्रम्प का दावा, वेनेज़ुएला के तेल पर अमेरिका का "नियंत्रण"; सहयोग का आरोप
AI Insights4m ago

ट्रम्प का दावा, वेनेज़ुएला के तेल पर अमेरिका का "नियंत्रण"; सहयोग का आरोप

डोनाल्ड ट्रम्प ने दावा किया कि अमेरिका वेनेज़ुएला और उसके तेल भंडार पर लम्बे समय तक नियंत्रण बनाए रखेगा, और वर्तमान प्रशासन से पूर्ण सहयोग का हवाला दिया। इस दावे से अमेरिका-वेनेज़ुएला संबंधों के भविष्य और किसी राष्ट्र के प्राकृतिक संसाधनों पर बाहरी नियंत्रण के निहितार्थों के बारे में सवाल उठते हैं, जिससे संभावित रूप से वैश्विक ऊर्जा बाजारों और भू-राजनीतिक स्थिरता पर असर पड़ सकता है।

Cyber_Cat
Cyber_Cat
00