MongoDB cree que la mejora en la recuperación de datos, en lugar de simplemente modelos de IA más grandes, es crucial para construir sistemas de IA empresariales confiables. A medida que los sistemas agentic y la Generación Aumentada por Recuperación (RAG) ganan terreno en entornos de producción, el proveedor de bases de datos ha identificado la calidad de la recuperación como un cuello de botella significativo que puede impactar negativamente la precisión, la rentabilidad y la confianza del usuario, incluso cuando los modelos de IA subyacentes son robustos.
Para abordar este desafío, MongoDB lanzó recientemente cuatro nuevas versiones de sus modelos de embeddings y reranking, conocidos colectivamente como Voyage 4. Estos modelos están diseñados para mejorar la precisión y la eficiencia de la recuperación de datos en aplicaciones de IA. La familia Voyage 4 incluye voyage-4 embedding, un modelo de propósito general; voyage-4-large, considerado el modelo insignia; voyage-4-lite, optimizado para aplicaciones de baja latencia y sensibles a los costos; y voyage-4-nano, destinado al desarrollo local, las pruebas y la recuperación de datos en el dispositivo. Voyage-4-nano marca la primera incursión de MongoDB en modelos de peso abierto.
Todos los modelos de Voyage 4 son accesibles a través de una API y en la plataforma Atlas de MongoDB. Según MongoDB, estos modelos superan a los modelos comparables en calidad de recuperación.
El énfasis en la calidad de la recuperación destaca una creciente comprensión dentro de la comunidad de la IA de que la eficacia de los sistemas de IA depende no solo del poder de los modelos en sí mismos, sino también de su capacidad para acceder y procesar información relevante de manera eficiente. Los sistemas RAG, por ejemplo, se basan en la recuperación de documentos o fragmentos de datos relevantes para aumentar el conocimiento de un modelo de lenguaje grande (LLM) antes de generar una respuesta. Si el componente de recuperación es débil, el LLM puede recibir información inexacta o incompleta, lo que lleva a resultados subóptimos.
Los sistemas agentic, que están diseñados para realizar tareas de forma autónoma, también dependen de una recuperación de datos confiable para tomar decisiones informadas y tomar las medidas adecuadas. La mala calidad de la recuperación en estos sistemas puede provocar errores, ineficiencias e incluso resultados potencialmente dañinos.
El enfoque de MongoDB en los modelos de embeddings y reranking refleja una tendencia hacia la optimización de todo el pipeline de IA, desde la ingesta de datos hasta la implementación del modelo. Al mejorar la precisión y la eficiencia de la recuperación de datos, las empresas pueden construir sistemas de IA más confiables y efectivos que ofrezcan un valor comercial tangible. La disponibilidad de estos modelos a través de una API y en la plataforma Atlas simplifica la integración para los desarrolladores y las organizaciones que buscan mejorar sus capacidades de IA. La compañía declaró que los modelos superan a modelos similares.
Discussion
Join the conversation
Be the first to comment