MongoDB estime qu'une récupération de données améliorée, plutôt que de simples modèles d'IA plus vastes, est essentielle pour bâtir des systèmes d'IA d'entreprise fiables. Alors que les systèmes agentiques et la génération augmentée par la récupération (RAG) gagnent du terrain dans les environnements de production, le fournisseur de bases de données a identifié la qualité de la récupération comme un goulot d'étranglement important qui peut avoir un impact négatif sur la précision, la rentabilité et la confiance des utilisateurs, même lorsque les modèles d'IA sous-jacents sont robustes.
Pour relever ce défi, MongoDB a récemment lancé quatre nouvelles versions de ses modèles d'embeddings et de reranking, collectivement appelées Voyage 4. Ces modèles sont conçus pour améliorer la précision et l'efficacité de la récupération de données dans les applications d'IA. La famille Voyage 4 comprend voyage-4 embedding, un modèle à usage général ; voyage-4-large, considéré comme le modèle phare ; voyage-4-lite, optimisé pour la faible latence et les applications sensibles aux coûts ; et voyage-4-nano, destiné au développement local, aux tests et à la récupération de données sur l'appareil. Voyage-4-nano marque la première incursion de MongoDB dans les modèles à poids ouverts.
Tous les modèles Voyage 4 sont accessibles via une API et sur la plateforme Atlas de MongoDB. Selon MongoDB, ces modèles surpassent les modèles comparables en termes de qualité de récupération.
L'accent mis sur la qualité de la récupération met en évidence une compréhension croissante au sein de la communauté de l'IA que l'efficacité des systèmes d'IA dépend non seulement de la puissance des modèles eux-mêmes, mais aussi de leur capacité à accéder et à traiter efficacement les informations pertinentes. Les systèmes RAG, par exemple, s'appuient sur la récupération de documents ou d'extraits de données pertinents pour augmenter les connaissances d'un grand modèle de langage (LLM) avant de générer une réponse. Si le composant de récupération est faible, le LLM peut être alimenté avec des informations inexactes ou incomplètes, ce qui entraîne des résultats sous-optimaux.
Les systèmes agentiques, qui sont conçus pour effectuer des tâches de manière autonome, dépendent également d'une récupération de données fiable pour prendre des décisions éclairées et entreprendre des actions appropriées. Une mauvaise qualité de récupération dans ces systèmes peut entraîner des erreurs, des inefficacités, voire des résultats potentiellement néfastes.
L'attention que MongoDB porte aux modèles d'embeddings et de reranking reflète une tendance à optimiser l'ensemble du pipeline d'IA, de l'ingestion des données au déploiement des modèles. En améliorant la précision et l'efficacité de la récupération des données, les entreprises peuvent construire des systèmes d'IA plus fiables et plus efficaces qui offrent une valeur commerciale tangible. La disponibilité de ces modèles via une API et sur la plateforme Atlas simplifie l'intégration pour les développeurs et les organisations qui cherchent à améliorer leurs capacités d'IA. L'entreprise a déclaré que les modèles surpassent les modèles similaires.
Discussion
Join the conversation
Be the first to comment