अक्टूबर 2025 में शोधकर्ताओं ने प्रदर्शित किया कि अधिकांश एआई सुरक्षा बचावों को आसानी से तोड़ा जा सकता है, जिससे वर्तमान एआई सुरक्षा उत्पादों की प्रभावशीलता के बारे में गंभीर चिंताएँ बढ़ गई हैं। OpenAI, Anthropic और Google DeepMind की एक टीम ने "The Attacker Moves Second: Stronger Adaptive Attacks Bypass Defenses Against Llm Jailbreaks and Prompt Injections" नामक एक पेपर प्रकाशित किया, जिसमें उन्होंने विस्तृत रूप से बताया कि कैसे उन्होंने 12 प्रकाशित एआई बचावों को सफलतापूर्वक विफल कर दिया, जिनमें से कई ने लगभग शून्य आक्रमण सफलता दर का दावा किया था। शोध सुरक्षा उपायों और संभावित हमलों की परिष्कृतता के बीच एक महत्वपूर्ण अंतर को उजागर करता है।
अध्ययन से पता चला कि अनुसंधान दल ने परीक्षण किए गए अधिकांश बचावों पर 90% से अधिक की बाईपास दर हासिल की। इससे पता चलता है कि कई एआई सुरक्षा उत्पादों का वास्तविक हमलावर व्यवहारों के खिलाफ पर्याप्त परीक्षण नहीं किया जा रहा है। टीम ने अनुकूली हमले की स्थितियों के तहत प्रॉम्प्टिंग-आधारित, प्रशिक्षण-आधारित और फ़िल्टरिंग-आधारित बचावों का मूल्यांकन किया, और पाया कि वे सभी असुरक्षित थे। उदाहरण के लिए, प्रॉम्प्टिंग बचावों ने अनुकूली हमलों के तहत 95% से 99% तक की आक्रमण सफलता दर का अनुभव किया। प्रशिक्षण-आधारित विधियों का प्रदर्शन भी समान रूप से खराब रहा, जिसमें बाईपास दर 96% से 100% तक पहुँच गई।
बचावों का कठोरता से परीक्षण करने के लिए, शोधकर्ताओं ने एक व्यापक कार्यप्रणाली तैयार की जिसमें 14 लेखक और सफल हमलों के लिए $20,000 का पुरस्कार पूल शामिल था। इस दृष्टिकोण का उद्देश्य वास्तविक दुनिया की प्रतिकूल परिस्थितियों का अनुकरण करना और प्रभावी बाईपास तकनीकों के विकास को प्रोत्साहित करना था। तथ्य यह है कि शोधकर्ता बचावों पर लगातार काबू पाने में सक्षम थे, उनकी दावा की गई लगभग शून्य आक्रमण सफलता दर के बावजूद, समस्या की गंभीरता को रेखांकित करता है।
जनवरी 2026 में लिखते हुए, लुईस कोलंबस ने उद्यमों के लिए निहितार्थों पर जोर दिया, जिसमें कहा गया कि कई एआई सुरक्षा उत्पादों का परीक्षण ऐसे हमलावरों के खिलाफ किया जा रहा है जो वास्तविक हमलावरों की तरह व्यवहार नहीं करते हैं। इससे सुरक्षा टीमों की उचित परिश्रम प्रक्रियाओं और विक्रेता दावों की सटीकता के बारे में सवाल उठते हैं।
निष्कर्षों ने एआई सुरक्षा परीक्षण के लिए अधिक मजबूत और प्रतिकूल दृष्टिकोण का आह्वान किया है। विशेषज्ञों का सुझाव है कि संगठन विक्रेताओं से उनकी परीक्षण पद्धतियों के बारे में महत्वपूर्ण प्रश्न पूछें, जिसमें यह भी शामिल है कि क्या उन्हें अनुकूली हमलों और रेड टीमिंग अभ्यासों के अधीन किया गया है। शोध एआई बचावों की निरंतर निगरानी और अनुकूलन की आवश्यकता पर भी प्रकाश डालता है, क्योंकि हमलावर लगातार अपनी तकनीकों का विकास करते हैं। एआई प्रौद्योगिकी की तीव्र उन्नति के लिए सुरक्षा के लिए एक सक्रिय और गतिशील दृष्टिकोण की आवश्यकता है, न कि स्थिर बचावों पर निर्भर रहने की जिन्हें आसानी से बाईपास किया जा सकता है।
Discussion
Join the conversation
Be the first to comment