MongoDB considera que la mejora en la recuperación de datos, en lugar de simplemente modelos de IA más grandes, es crucial para construir sistemas de IA empresariales confiables. A medida que los sistemas agentic y la Generación Aumentada por Recuperación (RAG) se trasladan a producción, el proveedor de bases de datos ha identificado la calidad de la recuperación como una debilidad significativa que puede impactar negativamente la precisión, el costo y la confianza del usuario, incluso si los modelos subyacentes son sólidos.
Para abordar esto, MongoDB lanzó cuatro nuevas versiones de sus modelos de embeddings y reranking, todos bajo el paraguas de "Voyage 4". Estos modelos están diseñados para mejorar la eficiencia y la precisión de la recuperación de datos en los sistemas de IA. Voyage 4 está disponible en cuatro modos: voyage-4 embedding, voyage-4-large, voyage-4-lite y voyage-4-nano.
Según MongoDB, voyage-4 embedding sirve como su modelo de propósito general, mientras que Voyage-4-large se considera su modelo insignia. Voyage-4-lite está optimizado para tareas que requieren baja latencia y costos reducidos. Voyage-4-nano está destinado a entornos locales de desarrollo y pruebas, así como a la recuperación de datos en el dispositivo. En particular, voyage-4-nano es el primer modelo de código abierto de MongoDB.
Los cuatro modelos son accesibles a través de una API y en la plataforma Atlas de MongoDB. La compañía afirma que estos modelos superan a modelos similares disponibles actualmente.
El enfoque en la calidad de la recuperación destaca una creciente preocupación en la industria de la IA. Si bien los modelos de lenguaje grandes (LLM) han atraído una atención significativa, la capacidad de recuperar eficazmente información relevante de bases de datos y bases de conocimiento es esencial para construir aplicaciones de IA confiables y precisas. Los sistemas RAG, en particular, dependen de una recuperación precisa para aumentar el conocimiento de los LLM con datos externos.
Las implicaciones de una mala calidad de recuperación se extienden más allá de meras imprecisiones. Una recuperación inexacta o ineficiente puede conducir a un aumento de los costos debido al desperdicio de recursos computacionales y puede erosionar la confianza del usuario en los sistemas de IA. A medida que la IA se integra más en los procesos empresariales críticos, garantizar la fiabilidad de la recuperación de datos es primordial.
El énfasis de MongoDB en la calidad de la recuperación sugiere un cambio de enfoque dentro de la comunidad de la IA. En lugar de buscar únicamente modelos más grandes y complejos, las empresas están comenzando a reconocer la importancia de optimizar toda la canalización de la IA, incluida la recuperación de datos. Este enfoque holístico es esencial para construir sistemas de IA que no solo sean potentes, sino también confiables y rentables.
La disponibilidad de los modelos Voyage 4 de MongoDB representa un paso hacia la solución de los desafíos de la calidad de la recuperación en la IA empresarial. La compañía planea continuar desarrollando y perfeccionando sus modelos para satisfacer las necesidades cambiantes de la industria de la IA.
Discussion
Join the conversation
Be the first to comment