MongoDB estime qu'une meilleure récupération des données, plutôt que de simplement augmenter la taille des modèles d'IA, est cruciale pour construire des systèmes d'IA d'entreprise fiables. Alors que les systèmes agentiques et la génération augmentée par récupération (RAG) gagnent du terrain dans les environnements de production, le fournisseur de bases de données a identifié la qualité de la récupération comme un goulot d'étranglement important qui peut avoir un impact négatif sur la précision, la rentabilité et la confiance des utilisateurs, même lorsque les modèles d'IA sous-jacents sont robustes.
Pour relever ce défi, MongoDB a récemment lancé quatre nouvelles versions de ses modèles d'embeddings et de reranking, collectivement appelées Voyage 4. Ces modèles sont conçus pour améliorer la précision et l'efficacité des processus de récupération de données au sein des applications d'IA. La famille Voyage 4 comprend voyage-4 embedding, un modèle à usage général ; voyage-4-large, considéré comme le modèle phare de MongoDB ; voyage-4-lite, optimisé pour une faible latence et les applications sensibles aux coûts ; et voyage-4-nano, destiné au développement local, aux tests et à la récupération de données sur l'appareil. Voyage-4-nano marque la première incursion de MongoDB dans les modèles à poids ouverts.
Tous les modèles Voyage 4 sont accessibles via une API et sur la plateforme Atlas de MongoDB. Selon l'entreprise, ces modèles surpassent les offres comparables sur le marché.
L'accent mis sur la qualité de la récupération met en évidence une prise de conscience croissante au sein de la communauté de l'IA que la performance des systèmes agentiques et RAG dépend fortement de la capacité à accéder efficacement et précisément aux informations pertinentes. Les systèmes RAG, en particulier, s'appuient sur la récupération d'informations à partir d'une base de connaissances pour augmenter les invites données aux grands modèles de langage (LLM), améliorant ainsi la précision et la fiabilité des réponses générées. Une mauvaise récupération peut entraîner l'alimentation du LLM avec des informations inexactes ou incomplètes, ce qui se traduit par des résultats erronés et une diminution de la confiance des utilisateurs.
En se concentrant sur l'optimisation des modèles d'embeddings et de reranking, MongoDB vise à améliorer la performance globale et la fiabilité des applications d'IA qui reposent sur une récupération efficace des données. La disponibilité de différents modèles Voyage 4 répond à un éventail de cas d'utilisation, des applications à usage général aux environnements aux ressources limitées. La nature à poids ouvert de Voyage-4-nano encourage également la collaboration communautaire et l'innovation dans le domaine de la récupération de données pour l'IA.
Ce développement marque un changement d'orientation dans le paysage de l'IA, reconnaissant que les progrès de la taille des modèles seuls ne suffisent pas à garantir des systèmes d'IA fiables et précis. Au lieu de cela, une approche holistique qui prend en compte l'ensemble du pipeline d'IA, y compris la récupération des données, est essentielle pour construire des solutions d'IA d'entreprise fiables et efficaces. L'entreprise a déclaré que les modèles sont disponibles dès maintenant.
Discussion
Join the conversation
Be the first to comment