MongoDB cree que una mejor recuperación de datos, en lugar de simplemente modelos de IA más grandes, es crucial para construir sistemas de IA empresariales confiables. A medida que los sistemas agentic y la Generación Aumentada por Recuperación (RAG) se trasladan a entornos de producción, el proveedor de bases de datos ha identificado la calidad de la recuperación como una debilidad significativa que puede impactar negativamente la precisión, la rentabilidad y la confianza del usuario, incluso cuando los modelos de IA subyacentes están funcionando de manera óptima.
Para abordar este problema, MongoDB lanzó cuatro nuevas versiones de sus modelos de embeddings y reranking, conocidos colectivamente como Voyage 4. Estos modelos están diseñados para mejorar la eficiencia y la precisión de la recuperación de datos en aplicaciones de IA. La familia Voyage 4 incluye voyage-4 embedding, un modelo de propósito general; voyage-4-large, considerado el modelo insignia de MongoDB; voyage-4-lite, optimizado para aplicaciones de baja latencia y sensibles a los costos; y voyage-4-nano, destinado al desarrollo local, las pruebas y la recuperación de datos en el dispositivo. Voyage-4-nano es también el primer modelo de código abierto de MongoDB.
Todos los modelos de Voyage 4 son accesibles a través de una API y en la plataforma Atlas de MongoDB. Según MongoDB, estos modelos superan a los modelos comparables en el mercado.
El énfasis en la calidad de la recuperación destaca una creciente preocupación dentro de la comunidad de la IA. Si bien se presta mucha atención a las capacidades de los grandes modelos de lenguaje (LLM), la eficacia de estos modelos depende en gran medida de la calidad de los datos que reciben. Los sistemas RAG, por ejemplo, se basan en la recuperación de información relevante de una base de datos o base de conocimiento para aumentar las respuestas del LLM. Si el proceso de recuperación es defectuoso, el LLM puede generar resultados inexactos o irrelevantes, lo que socava la fiabilidad de todo el sistema.
Los sistemas agentic, que están diseñados para realizar tareas de forma autónoma, también dependen de una recuperación de datos precisa para tomar decisiones informadas. Una mala calidad de la recuperación puede provocar errores, ineficiencias y falta de confianza en las capacidades del sistema.
El enfoque de MongoDB en los modelos de embeddings y reranking refleja una estrategia para mejorar la precisión y la eficiencia de la recuperación de datos. Los modelos de embeddings transforman los datos en representaciones numéricas que capturan las relaciones semánticas, lo que permite búsquedas de similitud más precisas. Los modelos de reranking refinan aún más los resultados de la búsqueda priorizando la información más relevante.
La disponibilidad de diferentes modelos de Voyage 4 se adapta a una variedad de casos de uso, desde aplicaciones de propósito general hasta tareas especializadas que requieren baja latencia o procesamiento en el dispositivo. El lanzamiento de un modelo de código abierto, Voyage-4-nano, también indica un compromiso con la transparencia y la colaboración comunitaria.
El desarrollo subraya la importancia de una infraestructura de datos robusta en la era de la IA. A medida que los sistemas de IA se integran más en los flujos de trabajo empresariales, la necesidad de una recuperación de datos fiable y eficiente no hará sino crecer. Las últimas ofertas de MongoDB tienen como objetivo abordar esta necesidad crítica y contribuir al desarrollo de aplicaciones de IA más confiables y eficaces.
Discussion
Join the conversation
Be the first to comment