A MongoDB acredita que aprimorar a recuperação de dados, em vez de simplesmente aumentar o tamanho dos modelos de IA, é crucial para construir sistemas de IA empresariais confiáveis. À medida que os sistemas agentic e a Geração Aumentada por Recuperação (RAG) entram em ambientes de produção, o provedor de banco de dados identificou a qualidade da recuperação como uma fraqueza significativa que pode impactar negativamente a precisão, a relação custo-benefício e a confiança do usuário, mesmo quando os modelos de IA subjacentes estão funcionando de forma otimizada.
Para resolver este problema, a MongoDB lançou quatro novas versões de seus modelos de embeddings e reranking, conhecidos coletivamente como Voyage 4. Esses modelos são projetados para aprimorar a eficiência e a precisão da recuperação de dados em aplicações de IA. A família Voyage 4 inclui o voyage-4 embedding, um modelo de uso geral; o voyage-4-large, considerado o modelo principal da MongoDB; o voyage-4-lite, otimizado para baixa latência e aplicações sensíveis a custos; e o voyage-4-nano, destinado ao desenvolvimento local, testes e recuperação de dados no dispositivo. O Voyage-4-nano também é o primeiro modelo de código aberto da MongoDB.
Todos os modelos Voyage 4 são acessíveis através de uma API e na plataforma Atlas da MongoDB. De acordo com a MongoDB, esses modelos superam modelos comparáveis no mercado.
A ênfase na qualidade da recuperação destaca uma crescente preocupação dentro da comunidade de IA. Embora muita atenção seja focada nas capacidades dos grandes modelos de linguagem (LLMs), a eficácia desses modelos depende fortemente da qualidade dos dados que recebem. Os sistemas RAG, por exemplo, dependem da recuperação de informações relevantes de um banco de dados ou base de conhecimento para aumentar as respostas do LLM. Se o processo de recuperação for falho, o LLM pode gerar saídas imprecisas ou irrelevantes, minando a confiabilidade de todo o sistema.
Os sistemas agentic, que são projetados para executar tarefas de forma autônoma, também dependem da recuperação precisa de dados para tomar decisões informadas. A má qualidade da recuperação pode levar a erros, ineficiências e falta de confiança nas capacidades do sistema.
O foco da MongoDB em modelos de embeddings e reranking reflete uma estratégia para melhorar a precisão e a eficiência da recuperação de dados. Os modelos de embeddings transformam dados em representações numéricas que capturam relações semânticas, permitindo buscas de similaridade mais precisas. Os modelos de reranking refinam ainda mais os resultados da busca, priorizando as informações mais relevantes.
A disponibilidade de diferentes modelos Voyage 4 atende a uma variedade de casos de uso, desde aplicações de uso geral até tarefas especializadas que exigem baixa latência ou processamento no dispositivo. O lançamento de um modelo de código aberto, o Voyage-4-nano, também sinaliza um compromisso com a transparência e a colaboração da comunidade.
O desenvolvimento ressalta a importância de uma infraestrutura de dados robusta na era da IA. À medida que os sistemas de IA se tornam mais integrados nos fluxos de trabalho empresariais, a necessidade de recuperação de dados confiável e eficiente só continuará a crescer. As últimas ofertas da MongoDB visam atender a essa necessidade crítica e contribuir para o desenvolvimento de aplicações de IA mais confiáveis e eficazes.
Discussion
Join the conversation
Be the first to comment