A MongoDB acredita que a recuperação de dados aprimorada, em vez de simplesmente modelos de IA maiores, é crucial para construir sistemas de IA empresariais confiáveis. À medida que os sistemas agentic e a Geração Aumentada por Recuperação (RAG) ganham força em ambientes de produção, o provedor de banco de dados identificou a qualidade da recuperação como uma fraqueza significativa, muitas vezes negligenciada. Essa fraqueza, de acordo com a MongoDB, pode impactar negativamente a precisão, a relação custo-benefício e a confiança do usuário, mesmo que os modelos de IA subjacentes estejam funcionando de forma otimizada.
Para resolver esse problema, a MongoDB lançou recentemente quatro novas versões de seus modelos de embeddings e reranking, conhecidos coletivamente como Voyage 4. Esses modelos são projetados para aprimorar a eficiência e a precisão da recuperação de dados em aplicações de IA. A família Voyage 4 inclui voyage-4 embedding, um modelo de uso geral; voyage-4-large, considerado o modelo principal; voyage-4-lite, otimizado para baixa latência e tarefas sensíveis a custos; e voyage-4-nano, destinado ao desenvolvimento local, testes e recuperação de dados no dispositivo. Notavelmente, voyage-4-nano é o primeiro modelo de peso aberto da MongoDB.
Todos os modelos Voyage 4 são acessíveis por meio de uma API e na plataforma Atlas da MongoDB. A empresa afirma que esses modelos superam modelos comparáveis no mercado.
A ênfase na qualidade da recuperação destaca uma crescente preocupação dentro da comunidade de IA. Embora muita atenção esteja focada no desenvolvimento de modelos de IA cada vez maiores e mais complexos, a capacidade de recuperar dados relevantes de forma eficiente e precisa é frequentemente um gargalo. Os sistemas RAG, por exemplo, dependem da recuperação de informações de uma base de conhecimento para aumentar as respostas geradas por um modelo de linguagem grande (LLM). Se o processo de recuperação for falho, o LLM pode ser alimentado com informações imprecisas ou incompletas, levando a resultados ruins.
Os sistemas agentic, que são projetados para realizar tarefas de forma autônoma, também dependem da recuperação de dados confiável para tomar decisões informadas. A má qualidade da recuperação pode levar os agentes a fazerem escolhas incorretas ou a não concluírem seus objetivos de forma eficaz.
O foco da MongoDB em modelos de embeddings e reranking visa melhorar a precisão e a eficiência do processo de recuperação. Os modelos de embeddings convertem texto ou outros dados em representações numéricas que capturam o significado semântico. Essas representações podem então ser usadas para identificar rapidamente dados relevantes com base na similaridade. Os modelos de reranking refinam ainda mais os resultados, priorizando os itens mais relevantes.
A disponibilidade desses modelos por meio de uma API e na plataforma Atlas os torna acessíveis a uma ampla gama de desenvolvedores e organizações. A natureza de peso aberto do voyage-4-nano também permite maior flexibilidade e personalização.
O desenvolvimento significa uma mudança de foco dentro da indústria de IA, reconhecendo que a IA confiável requer não apenas modelos poderosos, mas também mecanismos robustos de recuperação de dados. O sucesso dos modelos Voyage 4 da MongoDB pode ter implicações significativas para o futuro da IA empresarial, potencialmente levando a aplicações de IA mais precisas, econômicas e confiáveis.
Discussion
Join the conversation
Be the first to comment