MongoDB estime qu'une meilleure récupération des données, plutôt que des modèles d'IA simplement plus grands, est essentielle pour construire des systèmes d'IA d'entreprise fiables. Alors que les systèmes agentiques et la génération augmentée par la récupération (RAG) passent en environnements de production, le fournisseur de bases de données a identifié la qualité de la récupération comme une faiblesse importante qui peut avoir un impact négatif sur la précision, la rentabilité et la confiance des utilisateurs, même lorsque les modèles d'IA sous-jacents fonctionnent de manière optimale.
Pour résoudre ce problème, MongoDB a lancé quatre nouvelles versions de ses modèles d'embeddings et de reranking, collectivement appelés Voyage 4. Ces modèles sont conçus pour améliorer l'efficacité et la précision de la récupération des données dans les applications d'IA. La famille Voyage 4 comprend voyage-4 embedding, un modèle à usage général ; voyage-4-large, considéré comme le modèle phare de MongoDB ; voyage-4-lite, optimisé pour une faible latence et les applications sensibles aux coûts ; et voyage-4-nano, destiné au développement local, aux tests et à la récupération de données sur l'appareil. Voyage-4-nano est également le premier modèle à poids ouvert de MongoDB.
Tous les modèles Voyage 4 sont accessibles via une API et sur la plateforme Atlas de MongoDB. Selon MongoDB, ces modèles surpassent les modèles comparables sur le marché.
L'accent mis sur la qualité de la récupération souligne une préoccupation croissante au sein de la communauté de l'IA. Bien que l'attention se concentre largement sur les capacités des grands modèles de langage (LLM), l'efficacité de ces modèles dépend fortement de la qualité des données qu'ils reçoivent. Les systèmes RAG, par exemple, s'appuient sur la récupération d'informations pertinentes à partir d'une base de données ou d'une base de connaissances pour augmenter les réponses du LLM. Si le processus de récupération est défectueux, le LLM peut générer des sorties inexactes ou non pertinentes, ce qui compromet la fiabilité de l'ensemble du système.
Les systèmes agentiques, qui sont conçus pour effectuer des tâches de manière autonome, dépendent également d'une récupération précise des données pour prendre des décisions éclairées. Une mauvaise qualité de récupération peut entraîner des erreurs, des inefficacités et un manque de confiance dans les capacités du système.
L'attention portée par MongoDB aux modèles d'embeddings et de reranking reflète une stratégie visant à améliorer la précision et l'efficacité de la récupération des données. Les modèles d'embeddings transforment les données en représentations numériques qui capturent les relations sémantiques, permettant des recherches de similarité plus précises. Les modèles de reranking affinent davantage les résultats de la recherche en donnant la priorité aux informations les plus pertinentes.
La disponibilité de différents modèles Voyage 4 répond à un éventail de cas d'utilisation, des applications à usage général aux tâches spécialisées nécessitant une faible latence ou un traitement sur l'appareil. La publication d'un modèle à poids ouvert, Voyage-4-nano, signale également un engagement en faveur de la transparence et de la collaboration communautaire.
Ce développement souligne l'importance d'une infrastructure de données robuste à l'ère de l'IA. À mesure que les systèmes d'IA s'intègrent davantage aux flux de travail de l'entreprise, le besoin d'une récupération de données fiable et efficace ne fera que croître. Les dernières offres de MongoDB visent à répondre à ce besoin essentiel et à contribuer au développement d'applications d'IA plus fiables et plus efficaces.
Discussion
Join the conversation
Be the first to comment