تؤمن MongoDB بأن تحسين استرجاع البيانات، وليس مجرد نماذج الذكاء الاصطناعي الأكبر، هو أمر بالغ الأهمية لبناء أنظمة ذكاء اصطناعي مؤسسية جديرة بالثقة. مع اكتساب الأنظمة العاملة بالوكالة (agentic systems) والتوليد المعزز بالاسترجاع (Retrieval-Augmented Generation - RAG) قوة جذب في بيئات الإنتاج، حدد مزود قواعد البيانات جودة الاسترجاع كنقطة ضعف كبيرة، وغالبًا ما يتم تجاهلها. وفقًا لـ MongoDB، يمكن أن يؤثر هذا الضعف سلبًا على الدقة وفعالية التكلفة وثقة المستخدم، حتى لو كانت نماذج الذكاء الاصطناعي الأساسية تعمل على النحو الأمثل.
لمعالجة هذه المشكلة، أطلقت MongoDB مؤخرًا أربعة إصدارات جديدة من نماذج التضمين وإعادة الترتيب الخاصة بها، والمعروفة مجتمعة باسم Voyage 4. تم تصميم هذه النماذج لتحسين كفاءة ودقة استرجاع البيانات في تطبيقات الذكاء الاصطناعي. تتضمن عائلة Voyage 4 نموذج voyage-4 embedding، وهو نموذج للأغراض العامة؛ و voyage-4-large، الذي يعتبر النموذج الرائد؛ و voyage-4-lite، المحسن لمهام الكمون المنخفض والحساسة للتكلفة؛ و voyage-4-nano، المخصص للتطوير والاختبار المحليين واسترجاع البيانات على الجهاز. والجدير بالذكر أن voyage-4-nano هو أول نموذج مفتوح الوزن من MongoDB.
يمكن الوصول إلى جميع نماذج Voyage 4 من خلال واجهة برمجة تطبيقات (API) وعلى منصة Atlas الخاصة بـ MongoDB. تدعي الشركة أن هذه النماذج تتفوق على النماذج المماثلة في السوق.
يُبرز التركيز على جودة الاسترجاع قلقًا متزايدًا داخل مجتمع الذكاء الاصطناعي. في حين أن الكثير من الاهتمام ينصب على تطوير نماذج ذكاء اصطناعي أكبر وأكثر تعقيدًا من أي وقت مضى، فإن القدرة على استرجاع البيانات ذات الصلة بكفاءة ودقة غالبًا ما تكون بمثابة عنق الزجاجة. تعتمد أنظمة RAG، على سبيل المثال، على استرجاع المعلومات من قاعدة معرفية لزيادة الاستجابات التي تم إنشاؤها بواسطة نموذج لغوي كبير (LLM). إذا كانت عملية الاسترجاع معيبة، فقد يتم تزويد LLM بمعلومات غير دقيقة أو غير كاملة، مما يؤدي إلى نتائج ضعيفة.
تعتمد الأنظمة العاملة بالوكالة (agentic systems)، المصممة لأداء المهام بشكل مستقل، أيضًا على استرجاع بيانات موثوق لاتخاذ قرارات مستنيرة. يمكن أن تؤدي جودة الاسترجاع الضعيفة إلى اتخاذ الوكلاء خيارات غير صحيحة أو الفشل في إكمال أهدافهم بفعالية.
يهدف تركيز MongoDB على نماذج التضمين وإعادة الترتيب إلى تحسين دقة وكفاءة عملية الاسترجاع. تحول نماذج التضمين النص أو البيانات الأخرى إلى تمثيلات رقمية تلتقط المعنى الدلالي. يمكن بعد ذلك استخدام هذه التمثيلات لتحديد البيانات ذات الصلة بسرعة بناءً على التشابه. تعمل نماذج إعادة الترتيب على زيادة تحسين النتائج من خلال تحديد أولويات العناصر الأكثر صلة.
إن توفر هذه النماذج من خلال واجهة برمجة تطبيقات (API) وعلى منصة Atlas يجعلها في متناول مجموعة واسعة من المطورين والمؤسسات. تسمح الطبيعة مفتوحة الوزن لـ voyage-4-nano أيضًا بمرونة وتخصيص أكبر.
يشير هذا التطور إلى تحول في التركيز داخل صناعة الذكاء الاصطناعي، مع الاعتراف بأن الذكاء الاصطناعي الجدير بالثقة لا يتطلب نماذج قوية فحسب، بل يتطلب أيضًا آليات قوية لاسترجاع البيانات. يمكن أن يكون لنجاح نماذج Voyage 4 من MongoDB آثار كبيرة على مستقبل الذكاء الاصطناعي المؤسسي، مما قد يؤدي إلى تطبيقات ذكاء اصطناعي أكثر دقة وفعالية من حيث التكلفة وموثوقية.
Discussion
Join the conversation
Be the first to comment