ترى MongoDB أن تحسين استرجاع البيانات، وليس مجرد نماذج الذكاء الاصطناعي الأكبر، أمر بالغ الأهمية لبناء أنظمة ذكاء اصطناعي مؤسسية جديرة بالثقة. ومع انتقال الأنظمة العاملة بالوكلاء (agentic systems) والتوليد المعزز بالاسترجاع (RAG) إلى مرحلة الإنتاج، حدد مزود قاعدة البيانات جودة الاسترجاع كنقطة ضعف كبيرة يمكن أن تؤثر سلبًا على الدقة والتكلفة وثقة المستخدم، حتى لو كانت النماذج الأساسية قوية.
لمعالجة ذلك، أطلقت MongoDB أربع نسخ جديدة من نماذج التضمين وإعادة الترتيب الخاصة بها، وكلها تحت مظلة "Voyage 4". صُممت هذه النماذج لتحسين كفاءة ودقة استرجاع البيانات في أنظمة الذكاء الاصطناعي. يتوفر Voyage 4 بأربعة أوضاع: voyage-4 embedding، و voyage-4-large، و voyage-4-lite، و voyage-4-nano.
وفقًا لـ MongoDB، يعمل voyage-4 embedding كنموذج للأغراض العامة، بينما يعتبر Voyage-4-large نموذجه الرئيسي. تم تحسين Voyage-4-lite للمهام التي تتطلب زمن انتقال منخفض وتكاليف مخفضة. تم تصميم Voyage-4-nano لبيئات التطوير والاختبار المحلية، بالإضافة إلى استرجاع البيانات على الجهاز. والجدير بالذكر أن voyage-4-nano هو أول نموذج مفتوح الوزن من MongoDB.
يمكن الوصول إلى جميع النماذج الأربعة من خلال واجهة برمجة تطبيقات (API) وعلى منصة Atlas الخاصة بـ MongoDB. تدعي الشركة أن هذه النماذج تتفوق على النماذج المماثلة المتاحة حاليًا.
يسلط التركيز على جودة الاسترجاع الضوء على قلق متزايد في صناعة الذكاء الاصطناعي. في حين أن نماذج اللغة الكبيرة (LLMs) قد حظيت باهتمام كبير، فإن القدرة على استرجاع المعلومات ذات الصلة بشكل فعال من قواعد البيانات وقواعد المعرفة أمر ضروري لبناء تطبيقات ذكاء اصطناعي موثوقة ودقيقة. تعتمد أنظمة RAG، على وجه الخصوص، على الاسترجاع الدقيق لتعزيز معرفة نماذج اللغة الكبيرة ببيانات خارجية.
تتجاوز الآثار المترتبة على ضعف جودة الاسترجاع مجرد عدم الدقة. يمكن أن يؤدي الاسترجاع غير الدقيق أو غير الفعال إلى زيادة التكاليف بسبب إهدار الموارد الحسابية ويمكن أن يؤدي إلى تآكل ثقة المستخدم في أنظمة الذكاء الاصطناعي. مع ازدياد دمج الذكاء الاصطناعي في العمليات التجارية الهامة، فإن ضمان موثوقية استرجاع البيانات أمر بالغ الأهمية.
يشير تركيز MongoDB على جودة الاسترجاع إلى تحول في التركيز داخل مجتمع الذكاء الاصطناعي. بدلاً من مجرد السعي وراء نماذج أكبر وأكثر تعقيدًا، بدأت الشركات تدرك أهمية تحسين خط أنابيب الذكاء الاصطناعي بأكمله، بما في ذلك استرجاع البيانات. هذا النهج الشامل ضروري لبناء أنظمة ذكاء اصطناعي ليست قوية فحسب، بل أيضًا جديرة بالثقة وفعالة من حيث التكلفة.
يمثل توفر نماذج Voyage 4 من MongoDB خطوة نحو معالجة تحديات جودة الاسترجاع في الذكاء الاصطناعي المؤسسي. تخطط الشركة لمواصلة تطوير وتحسين نماذجها لتلبية الاحتياجات المتطورة لصناعة الذكاء الاصطناعي.
Discussion
Join the conversation
Be the first to comment