A MongoDB acredita que a recuperação de dados aprimorada, em vez de simplesmente modelos de IA maiores, é crucial para construir sistemas de IA empresariais confiáveis. À medida que os sistemas agentic e a Geração Aumentada por Recuperação (RAG) ganham força em ambientes de produção, o provedor de banco de dados identificou a qualidade da recuperação como um gargalo significativo que pode impactar negativamente a precisão, a relação custo-benefício e a confiança do usuário, mesmo quando os modelos de IA subjacentes são robustos.
Para enfrentar esse desafio, a MongoDB lançou recentemente quatro novas versões de seus modelos de embeddings e reranking, conhecidos coletivamente como Voyage 4. Esses modelos são projetados para aprimorar a precisão e a eficiência da recuperação de dados em aplicações de IA. A família Voyage 4 inclui o voyage-4 embedding, um modelo de uso geral; o voyage-4-large, considerado o modelo principal; o voyage-4-lite, otimizado para baixa latência e aplicações sensíveis a custos; e o voyage-4-nano, destinado ao desenvolvimento local, testes e recuperação de dados no dispositivo. O Voyage-4-nano marca a primeira incursão da MongoDB em modelos de peso aberto.
Todos os modelos Voyage 4 são acessíveis por meio de uma API e na plataforma Atlas da MongoDB. De acordo com a MongoDB, esses modelos superam modelos comparáveis em qualidade de recuperação.
A ênfase na qualidade da recuperação destaca uma crescente compreensão dentro da comunidade de IA de que a eficácia dos sistemas de IA depende não apenas do poder dos próprios modelos, mas também de sua capacidade de acessar e processar informações relevantes de forma eficiente. Os sistemas RAG, por exemplo, dependem da recuperação de documentos ou trechos de dados relevantes para aumentar o conhecimento de um modelo de linguagem grande (LLM) antes de gerar uma resposta. Se o componente de recuperação for fraco, o LLM pode ser alimentado com informações imprecisas ou incompletas, levando a resultados abaixo do ideal.
Os sistemas agentic, que são projetados para executar tarefas de forma autônoma, também dependem da recuperação confiável de dados para tomar decisões informadas e realizar ações apropriadas. A má qualidade da recuperação nesses sistemas pode levar a erros, ineficiências e até mesmo a resultados potencialmente prejudiciais.
O foco da MongoDB em modelos de embeddings e reranking reflete uma tendência de otimização de todo o pipeline de IA, desde a ingestão de dados até a implantação do modelo. Ao melhorar a precisão e a eficiência da recuperação de dados, as empresas podem construir sistemas de IA mais confiáveis e eficazes que ofereçam valor comercial tangível. A disponibilidade desses modelos por meio de uma API e na plataforma Atlas simplifica a integração para desenvolvedores e organizações que buscam aprimorar seus recursos de IA. A empresa afirmou que os modelos superam modelos semelhantes.
Discussion
Join the conversation
Be the first to comment