AI सिस्टम्स के लिए डॉक्यूमेंट अंडरस्टैंडिंग को बेहतर बनाने के लिए नए दृष्टिकोण सामने आ रहे हैं
उद्यम अपनी आंतरिक जानकारी का लाभ उठाने के लिए तेजी से रिट्रीवल-ऑगमेंटेड जनरेशन (RAG) सिस्टम अपना रहे हैं, लेकिन जटिल दस्तावेजों को सटीक रूप से संसाधित करने में चुनौतियां बनी हुई हैं। VentureBeat के अनुसार, जबकि RAG "आपके PDF को इंडेक्स करने, एक LLM को कनेक्ट करने और तुरंत आपके कॉर्पोरेट ज्ञान का लोकतंत्रीकरण करने" का वादा करता है, जटिल दस्तावेज़ों पर निर्भर उद्योगों के लिए वास्तविकता आदर्श से कम रही है।
मानक RAG पाइपलाइन अक्सर दस्तावेजों को साधारण टेक्स्ट स्ट्रिंग के रूप में मानती हैं, "फिक्स्ड-साइज़ चंकिंग" जैसे तरीकों का उपयोग करती हैं जो टेबल को स्लाइस करके, कैप्शन को अलग करके और विज़ुअल हाइरार्की को अनदेखा करके तकनीकी मैनुअल के तर्क को बाधित कर सकती हैं, VentureBeat ने रिपोर्ट किया। जब इंजीनियर विशिष्ट प्रश्न पूछते हैं तो इससे गलत परिणाम हो सकते हैं, जिससे AI "हैलुसिनेट" कर सकता है।
इन सीमाओं को दूर करने के लिए, नए फ्रेमवर्क विकसित किए जा रहे हैं। VentureBeat के अनुसार, ऐसा ही एक फ्रेमवर्क, PageIndex, दस्तावेज़ पुनर्प्राप्ति को खोज समस्या के बजाय नेविगेशन समस्या के रूप में मानकर एक अलग दृष्टिकोण अपनाता है। PageIndex मानक "चंक-एंड-एम्बेड" विधि को पूरी तरह से छोड़ देता है। VentureBeat ने नोट किया कि इस फ्रेमवर्क ने उन दस्तावेजों पर 98.7% सटीकता दर हासिल की जहां वेक्टर सर्च विफल रही।
बेहतर दस्तावेज़ समझ की आवश्यकता विशेष रूप से तीव्र है क्योंकि उद्यम वित्तीय विवरणों की ऑडिटिंग, कानूनी अनुबंधों का विश्लेषण और फार्मास्युटिकल प्रोटोकॉल को नेविगेट करने जैसे उच्च-दांव वाले वर्कफ़्लो में RAG का उपयोग करने का प्रयास करते हैं, VentureBeat ने रिपोर्ट किया। विफलता LLM में नहीं है, बल्कि प्रीप्रोसेसिंग में है।
दस्तावेज़ प्रसंस्करण के अलावा, अन्य वैज्ञानिक प्रगति भी हो रही है। अवसाद के लिए वैकल्पिक उपचार जैसे क्षेत्रों में अनुसंधान जारी है, अध्ययनों से पता चलता है कि एक कप कॉफी के साइकेडेलिक दवाओं की माइक्रो-डोजिंग से बेहतर परिणाम हो सकते हैं, Ars Technica के अनुसार। इसके अतिरिक्त, वैज्ञानिक कवक को एक संभावित कीटनाशक के रूप में उपयोग करने की खोज कर रहे हैं, जो बीटल और दीमक जैसे लकड़ी खाने वाले कीड़ों को नियंत्रित करने के लिए पारंपरिक तरीकों का एक कम हानिकारक विकल्प प्रदान करता है, Ars Technica ने रिपोर्ट किया।
Discussion
AI Experts & Community
Be the first to comment