MongoDB estime qu'une récupération de données améliorée, plutôt que de simples modèles d'IA plus vastes, est essentielle pour bâtir des systèmes d'IA d'entreprise fiables. Alors que les systèmes agentiques et la génération augmentée par la récupération (RAG) passent en production, le fournisseur de bases de données a identifié la qualité de la récupération comme une faiblesse importante qui peut avoir un impact négatif sur la précision, les coûts et la confiance des utilisateurs, même si les modèles sous-jacents sont performants.
Pour résoudre ce problème, MongoDB a lancé quatre nouvelles versions de ses modèles d'embeddings et de reranking, toutes regroupées sous l'appellation "Voyage 4". Ces modèles sont conçus pour améliorer l'efficacité et la précision de la récupération de données dans les systèmes d'IA. Voyage 4 est disponible en quatre modes : voyage-4 embedding, voyage-4-large, voyage-4-lite et voyage-4-nano.
Selon MongoDB, voyage-4 embedding sert de modèle à usage général, tandis que Voyage-4-large est considéré comme son modèle phare. Voyage-4-lite est optimisé pour les tâches nécessitant une faible latence et des coûts réduits. Voyage-4-nano est destiné aux environnements de développement et de test locaux, ainsi qu'à la récupération de données sur l'appareil. Notamment, voyage-4-nano est le premier modèle à poids ouvert de MongoDB.
Les quatre modèles sont accessibles via une API et sur la plateforme Atlas de MongoDB. L'entreprise affirme que ces modèles surpassent les modèles similaires actuellement disponibles.
L'accent mis sur la qualité de la récupération met en évidence une préoccupation croissante dans l'industrie de l'IA. Bien que les grands modèles de langage (LLM) aient suscité une attention considérable, la capacité de récupérer efficacement des informations pertinentes à partir de bases de données et de bases de connaissances est essentielle pour créer des applications d'IA fiables et précises. Les systèmes RAG, en particulier, reposent sur une récupération précise pour augmenter les connaissances des LLM avec des données externes.
Les implications d'une mauvaise qualité de récupération vont au-delà de simples inexactitudes. Une récupération inexacte ou inefficace peut entraîner une augmentation des coûts en raison du gaspillage des ressources de calcul et peut éroder la confiance des utilisateurs dans les systèmes d'IA. À mesure que l'IA s'intègre davantage dans les processus métier critiques, il est primordial de garantir la fiabilité de la récupération des données.
L'accent mis par MongoDB sur la qualité de la récupération suggère un changement d'orientation au sein de la communauté de l'IA. Plutôt que de se contenter de rechercher des modèles plus vastes et plus complexes, les entreprises commencent à reconnaître l'importance d'optimiser l'ensemble du pipeline d'IA, y compris la récupération des données. Cette approche holistique est essentielle pour construire des systèmes d'IA qui soient non seulement puissants, mais aussi fiables et rentables.
La disponibilité des modèles Voyage 4 de MongoDB représente une étape vers la résolution des défis de la qualité de la récupération dans l'IA d'entreprise. L'entreprise prévoit de continuer à développer et à affiner ses modèles pour répondre aux besoins évolutifs de l'industrie de l'IA.
Discussion
Join the conversation
Be the first to comment