MongoDB estime qu'une récupération de données améliorée, plutôt que de simples modèles d'IA plus volumineux, est essentielle pour construire des systèmes d'IA d'entreprise fiables. Alors que les systèmes agentiques et la génération augmentée par récupération (RAG) gagnent du terrain dans les environnements de production, le fournisseur de bases de données a identifié la qualité de la récupération comme une faiblesse importante, souvent négligée. Selon MongoDB, cette faiblesse peut avoir un impact négatif sur la précision, la rentabilité et la confiance des utilisateurs, même si les modèles d'IA sous-jacents fonctionnent de manière optimale.
Pour résoudre ce problème, MongoDB a récemment lancé quatre nouvelles versions de ses modèles d'embeddings et de reranking, collectivement appelées Voyage 4. Ces modèles sont conçus pour améliorer l'efficacité et la précision de la récupération de données dans les applications d'IA. La famille Voyage 4 comprend voyage-4 embedding, un modèle à usage général ; voyage-4-large, considéré comme le modèle phare ; voyage-4-lite, optimisé pour la faible latence et les tâches sensibles aux coûts ; et voyage-4-nano, destiné au développement local, aux tests et à la récupération de données sur l'appareil. Notamment, voyage-4-nano est le premier modèle open-weight de MongoDB.
Tous les modèles Voyage 4 sont accessibles via une API et sur la plateforme Atlas de MongoDB. L'entreprise affirme que ces modèles surpassent les modèles comparables sur le marché.
L'accent mis sur la qualité de la récupération met en évidence une préoccupation croissante au sein de la communauté de l'IA. Alors que l'attention se concentre largement sur le développement de modèles d'IA toujours plus grands et plus complexes, la capacité de récupérer efficacement et avec précision les données pertinentes est souvent un goulot d'étranglement. Les systèmes RAG, par exemple, s'appuient sur la récupération d'informations à partir d'une base de connaissances pour augmenter les réponses générées par un grand modèle de langage (LLM). Si le processus de récupération est défectueux, le LLM peut être alimenté avec des informations inexactes ou incomplètes, ce qui entraîne de mauvais résultats.
Les systèmes agentiques, qui sont conçus pour effectuer des tâches de manière autonome, dépendent également d'une récupération de données fiable pour prendre des décisions éclairées. Une mauvaise qualité de récupération peut amener les agents à faire des choix incorrects ou à ne pas atteindre leurs objectifs efficacement.
L'objectif de MongoDB sur les modèles d'embeddings et de reranking vise à améliorer la précision et l'efficacité du processus de récupération. Les modèles d'embeddings convertissent le texte ou d'autres données en représentations numériques qui capturent le sens sémantique. Ces représentations peuvent ensuite être utilisées pour identifier rapidement les données pertinentes en fonction de la similarité. Les modèles de reranking affinent davantage les résultats en donnant la priorité aux éléments les plus pertinents.
La disponibilité de ces modèles via une API et sur la plateforme Atlas les rend accessibles à un large éventail de développeurs et d'organisations. La nature open-weight de voyage-4-nano permet également une plus grande flexibilité et personnalisation.
Ce développement marque un changement d'orientation au sein de l'industrie de l'IA, reconnaissant qu'une IA fiable nécessite non seulement des modèles puissants, mais également des mécanismes de récupération de données robustes. Le succès des modèles Voyage 4 de MongoDB pourrait avoir des implications importantes pour l'avenir de l'IA d'entreprise, conduisant potentiellement à des applications d'IA plus précises, rentables et fiables.
Discussion
Join the conversation
Be the first to comment