A MongoDB acredita que a melhoria na recuperação de dados, e não apenas modelos de IA maiores, é crucial para construir sistemas de IA empresariais confiáveis. À medida que os sistemas agentic e a Geração Aumentada por Recuperação (RAG) entram em produção, o provedor de banco de dados identificou a qualidade da recuperação como uma fraqueza significativa que pode impactar negativamente a precisão, o custo e a confiança do usuário, mesmo que os modelos subjacentes sejam fortes.
Para resolver isso, a MongoDB lançou quatro novas versões de seus modelos de embeddings e reranking, todos sob o guarda-chuva "Voyage 4". Esses modelos são projetados para melhorar a eficiência e a precisão da recuperação de dados em sistemas de IA. O Voyage 4 está disponível em quatro modos: voyage-4 embedding, voyage-4-large, voyage-4-lite e voyage-4-nano.
De acordo com a MongoDB, o voyage-4 embedding serve como seu modelo de propósito geral, enquanto o Voyage-4-large é considerado seu modelo principal. O Voyage-4-lite é otimizado para tarefas que exigem baixa latência e custos reduzidos. O Voyage-4-nano é destinado a ambientes de desenvolvimento e teste locais, bem como à recuperação de dados no dispositivo. Notavelmente, o voyage-4-nano é o primeiro modelo de peso aberto da MongoDB.
Todos os quatro modelos são acessíveis por meio de uma API e na plataforma Atlas da MongoDB. A empresa afirma que esses modelos superam modelos semelhantes atualmente disponíveis.
O foco na qualidade da recuperação destaca uma crescente preocupação na indústria de IA. Embora os grandes modelos de linguagem (LLMs) tenham recebido atenção significativa, a capacidade de recuperar efetivamente informações relevantes de bancos de dados e bases de conhecimento é essencial para construir aplicações de IA confiáveis e precisas. Os sistemas RAG, em particular, dependem da recuperação precisa para aumentar o conhecimento dos LLMs com dados externos.
As implicações da má qualidade da recuperação vão além de meras imprecisões. A recuperação imprecisa ou ineficiente pode levar ao aumento de custos devido ao desperdício de recursos computacionais e pode corroer a confiança do usuário em sistemas de IA. À medida que a IA se torna mais integrada aos processos de negócios críticos, garantir a confiabilidade da recuperação de dados é fundamental.
A ênfase da MongoDB na qualidade da recuperação sugere uma mudança de foco dentro da comunidade de IA. Em vez de buscar apenas modelos maiores e mais complexos, as empresas estão começando a reconhecer a importância de otimizar todo o pipeline de IA, incluindo a recuperação de dados. Essa abordagem holística é essencial para construir sistemas de IA que não sejam apenas poderosos, mas também confiáveis e econômicos.
A disponibilidade dos modelos Voyage 4 da MongoDB representa um passo para enfrentar os desafios da qualidade da recuperação na IA empresarial. A empresa planeja continuar desenvolvendo e refinando seus modelos para atender às necessidades em evolução da indústria de IA.
Discussion
Join the conversation
Be the first to comment