A MongoDB acredita que aprimorar a recuperação de dados, em vez de simplesmente escalar modelos de IA, é crucial para construir sistemas de IA corporativos confiáveis. À medida que os sistemas agentic e a Geração Aumentada por Recuperação (RAG) ganham força em ambientes de produção, o provedor de banco de dados identificou a qualidade da recuperação como um gargalo significativo que pode impactar negativamente a precisão, a relação custo-benefício e a confiança do usuário, mesmo quando os modelos de IA subjacentes são robustos.
Para enfrentar esse desafio, a MongoDB lançou recentemente quatro novas versões de seus modelos de embeddings e reranking, conhecidos coletivamente como Voyage 4. Esses modelos são projetados para aprimorar a precisão e a eficácia dos processos de recuperação de dados em aplicações de IA. A família Voyage 4 inclui voyage-4 embedding, um modelo de uso geral; voyage-4-large, considerado o modelo principal da MongoDB; voyage-4-lite, otimizado para baixa latência e aplicações sensíveis a custos; e voyage-4-nano, destinado ao desenvolvimento local, testes e recuperação de dados no dispositivo. Voyage-4-nano marca a primeira incursão da MongoDB em modelos de peso aberto.
Todos os modelos Voyage 4 são acessíveis por meio de uma API e na plataforma Atlas da MongoDB. De acordo com a empresa, esses modelos superam ofertas comparáveis no mercado.
A ênfase na qualidade da recuperação destaca uma crescente conscientização dentro da comunidade de IA de que o desempenho dos sistemas agentic e RAG depende fortemente da capacidade de acessar informações relevantes de forma eficiente e precisa. Os sistemas RAG, em particular, dependem da recuperação de informações de uma base de conhecimento para aumentar os prompts fornecidos a grandes modelos de linguagem (LLMs), melhorando assim a precisão e a confiabilidade das respostas geradas. A recuperação inadequada pode levar a informações imprecisas ou incompletas sendo alimentadas ao LLM, resultando em saídas falhas e diminuição da confiança do usuário.
Ao se concentrar na otimização de modelos de embeddings e reranking, a MongoDB visa melhorar o desempenho geral e a confiabilidade de aplicações de IA que dependem da recuperação eficiente de dados. A disponibilidade de diferentes modelos Voyage 4 atende a uma variedade de casos de uso, desde aplicações de uso geral até ambientes com restrição de recursos. A natureza de peso aberto do Voyage-4-nano também incentiva a colaboração da comunidade e a inovação no campo da recuperação de dados para IA.
O desenvolvimento significa uma mudança de foco no cenário da IA, reconhecendo que os avanços no tamanho do modelo por si só não são suficientes para garantir sistemas de IA confiáveis e precisos. Em vez disso, uma abordagem holística que considere todo o pipeline de IA, incluindo a recuperação de dados, é essencial para construir soluções de IA corporativas confiáveis e eficazes. A empresa disse que os modelos estão disponíveis agora.
Discussion
Join the conversation
Be the first to comment