MongoDB cree que la mejora en la recuperación de datos, en lugar de simplemente escalar los modelos de IA, es crucial para construir sistemas de IA empresarial confiables. A medida que los sistemas agentic y la Generación Aumentada por Recuperación (RAG) ganan terreno en entornos de producción, el proveedor de bases de datos ha identificado la calidad de la recuperación como un cuello de botella significativo que puede impactar negativamente la precisión, la rentabilidad y la confianza del usuario, incluso cuando los modelos de IA subyacentes son robustos.
Para abordar este desafío, MongoDB lanzó recientemente cuatro nuevas versiones de sus modelos de embeddings y reranking, conocidos colectivamente como Voyage 4. Estos modelos están diseñados para mejorar la precisión y la eficacia de los procesos de recuperación de datos dentro de las aplicaciones de IA. La familia Voyage 4 incluye voyage-4 embedding, un modelo de propósito general; voyage-4-large, considerado el modelo insignia de MongoDB; voyage-4-lite, optimizado para baja latencia y aplicaciones sensibles a los costos; y voyage-4-nano, destinado al desarrollo local, las pruebas y la recuperación de datos en el dispositivo. Voyage-4-nano marca la primera incursión de MongoDB en modelos de código abierto.
Todos los modelos de Voyage 4 son accesibles a través de una API y en la plataforma Atlas de MongoDB. Según la compañía, estos modelos superan a las ofertas comparables en el mercado.
El énfasis en la calidad de la recuperación destaca una creciente conciencia dentro de la comunidad de IA de que el rendimiento de los sistemas agentic y RAG depende en gran medida de la capacidad de acceder de manera eficiente y precisa a la información relevante. Los sistemas RAG, en particular, se basan en la recuperación de información de una base de conocimiento para aumentar las indicaciones dadas a los modelos de lenguaje grandes (LLM), mejorando así la precisión y la confiabilidad de las respuestas generadas. Una recuperación deficiente puede llevar a que se alimente al LLM con información inexacta o incompleta, lo que resulta en resultados defectuosos y una menor confianza del usuario.
Al centrarse en la optimización de los modelos de embeddings y reranking, MongoDB tiene como objetivo mejorar el rendimiento general y la confiabilidad de las aplicaciones de IA que dependen de la recuperación eficiente de datos. La disponibilidad de diferentes modelos de Voyage 4 se adapta a una variedad de casos de uso, desde aplicaciones de propósito general hasta entornos con recursos limitados. La naturaleza de código abierto de Voyage-4-nano también fomenta la colaboración comunitaria y la innovación en el campo de la recuperación de datos para la IA.
El desarrollo significa un cambio de enfoque dentro del panorama de la IA, reconociendo que los avances en el tamaño del modelo por sí solos no son suficientes para garantizar sistemas de IA confiables y precisos. En cambio, un enfoque holístico que considere toda la canalización de IA, incluida la recuperación de datos, es esencial para construir soluciones de IA empresarial confiables y efectivas. La compañía dijo que los modelos están disponibles ahora.
Discussion
Join the conversation
Be the first to comment