MongoDB считает, что улучшенный поиск данных, а не просто более крупные модели ИИ, имеет решающее значение для создания надежных корпоративных систем ИИ. По мере того, как системы на основе агентов и Retrieval-Augmented Generation (RAG) набирают обороты в производственной среде, поставщик баз данных определил качество поиска как значительное узкое место, которое может негативно повлиять на точность, экономическую эффективность и доверие пользователей, даже если базовые модели ИИ надежны.
Чтобы решить эту проблему, MongoDB недавно запустила четыре новые версии своих моделей встраивания и переранжирования, известные под общим названием Voyage 4. Эти модели предназначены для повышения точности и эффективности поиска данных в приложениях ИИ. Семейство Voyage 4 включает voyage-4 embedding, модель общего назначения; voyage-4-large, считающуюся флагманской моделью; voyage-4-lite, оптимизированную для приложений с низкой задержкой и чувствительных к стоимости; и voyage-4-nano, предназначенную для локальной разработки, тестирования и поиска данных на устройстве. Voyage-4-nano знаменует собой первый выход MongoDB на рынок моделей с открытым весом.
Все модели Voyage 4 доступны через API и на платформе Atlas от MongoDB. По данным MongoDB, эти модели превосходят сопоставимые модели по качеству поиска.
Акцент на качестве поиска подчеркивает растущее понимание в сообществе ИИ того, что эффективность систем ИИ зависит не только от мощности самих моделей, но и от их способности эффективно получать доступ к релевантной информации и обрабатывать ее. Например, системы RAG полагаются на извлечение релевантных документов или фрагментов данных для расширения знаний большой языковой модели (LLM) перед генерацией ответа. Если компонент поиска слаб, LLM может получать неточную или неполную информацию, что приведет к неоптимальным результатам.
Системы на основе агентов, которые предназначены для автономного выполнения задач, также зависят от надежного поиска данных для принятия обоснованных решений и совершения соответствующих действий. Низкое качество поиска в этих системах может привести к ошибкам, неэффективности и даже потенциально вредным последствиям.
Внимание MongoDB к моделям встраивания и переранжирования отражает тенденцию к оптимизации всего конвейера ИИ, от приема данных до развертывания модели. Улучшая точность и эффективность поиска данных, компании могут создавать более надежные и эффективные системы ИИ, которые приносят ощутимую пользу для бизнеса. Доступность этих моделей через API и на платформе Atlas упрощает интеграцию для разработчиков и организаций, стремящихся расширить свои возможности в области ИИ. Компания заявила, что эти модели превосходят аналогичные модели.
Discussion
Join the conversation
Be the first to comment