MongoDB cree que la mejora en la recuperación de datos, en lugar de simplemente modelos de IA más grandes, es crucial para construir sistemas de IA empresariales confiables. A medida que los sistemas agentic y la Generación Aumentada por Recuperación (RAG) ganan terreno en entornos de producción, el proveedor de bases de datos ha identificado la calidad de la recuperación como una debilidad significativa, a menudo pasada por alto. Esta debilidad, según MongoDB, puede afectar negativamente la precisión, la rentabilidad y la confianza del usuario, incluso si los modelos de IA subyacentes están funcionando de manera óptima.
Para abordar este problema, MongoDB lanzó recientemente cuatro nuevas versiones de sus modelos de embeddings y reranking, conocidos colectivamente como Voyage 4. Estos modelos están diseñados para mejorar la eficiencia y la precisión de la recuperación de datos en aplicaciones de IA. La familia Voyage 4 incluye voyage-4 embedding, un modelo de propósito general; voyage-4-large, considerado el modelo insignia; voyage-4-lite, optimizado para tareas de baja latencia y sensibles a los costos; y voyage-4-nano, destinado al desarrollo local, las pruebas y la recuperación de datos en el dispositivo. En particular, voyage-4-nano es el primer modelo de código abierto de MongoDB.
Todos los modelos de Voyage 4 son accesibles a través de una API y en la plataforma Atlas de MongoDB. La compañía afirma que estos modelos superan a modelos comparables en el mercado.
El énfasis en la calidad de la recuperación destaca una creciente preocupación dentro de la comunidad de la IA. Si bien se presta mucha atención al desarrollo de modelos de IA cada vez más grandes y complejos, la capacidad de recuperar datos relevantes de manera eficiente y precisa es a menudo un cuello de botella. Los sistemas RAG, por ejemplo, se basan en la recuperación de información de una base de conocimiento para aumentar las respuestas generadas por un modelo de lenguaje grande (LLM). Si el proceso de recuperación es defectuoso, el LLM puede recibir información inexacta o incompleta, lo que lleva a resultados deficientes.
Los sistemas agentic, que están diseñados para realizar tareas de forma autónoma, también dependen de una recuperación de datos confiable para tomar decisiones informadas. Una mala calidad de recuperación puede llevar a que los agentes tomen decisiones incorrectas o no completen sus objetivos de manera efectiva.
El enfoque de MongoDB en los modelos de embeddings y reranking tiene como objetivo mejorar la precisión y la eficiencia del proceso de recuperación. Los modelos de embeddings convierten texto u otros datos en representaciones numéricas que capturan el significado semántico. Estas representaciones se pueden utilizar para identificar rápidamente datos relevantes basados en la similitud. Los modelos de reranking refinan aún más los resultados al priorizar los elementos más relevantes.
La disponibilidad de estos modelos a través de una API y en la plataforma Atlas los hace accesibles a una amplia gama de desarrolladores y organizaciones. La naturaleza de código abierto de voyage-4-nano también permite una mayor flexibilidad y personalización.
El desarrollo significa un cambio de enfoque dentro de la industria de la IA, reconociendo que la IA confiable requiere no solo modelos poderosos sino también mecanismos robustos de recuperación de datos. El éxito de los modelos Voyage 4 de MongoDB podría tener implicaciones significativas para el futuro de la IA empresarial, lo que podría conducir a aplicaciones de IA más precisas, rentables y confiables.
Discussion
Join the conversation
Be the first to comment