MongoDB считает, что улучшенный поиск данных, а не просто масштабирование моделей ИИ, имеет решающее значение для создания надежных корпоративных систем ИИ. По мере того, как системы, управляемые агентами, и генерация, дополненная поиском (Retrieval-Augmented Generation, RAG), набирают обороты в производственной среде, поставщик баз данных определил качество поиска как значительное узкое место, которое может негативно повлиять на точность, экономическую эффективность и доверие пользователей, даже если базовые модели ИИ надежны.
Чтобы решить эту проблему, MongoDB недавно выпустила четыре новые версии своих моделей встраивания и переранжирования, известные под общим названием Voyage 4. Эти модели предназначены для повышения точности и эффективности процессов поиска данных в приложениях ИИ. Семейство Voyage 4 включает в себя voyage-4 embedding, модель общего назначения; voyage-4-large, считающуюся флагманской моделью MongoDB; voyage-4-lite, оптимизированную для приложений с низкой задержкой и чувствительных к стоимости; и voyage-4-nano, предназначенную для локальной разработки, тестирования и поиска данных на устройстве. Voyage-4-nano знаменует собой первый выход MongoDB на рынок моделей с открытым весом.
Все модели Voyage 4 доступны через API и на платформе Atlas от MongoDB. По данным компании, эти модели превосходят сопоставимые предложения на рынке.
Акцент на качестве поиска подчеркивает растущее осознание в сообществе ИИ того, что производительность систем, управляемых агентами, и RAG в значительной степени зависит от способности эффективно и точно получать доступ к релевантной информации. Системы RAG, в частности, полагаются на извлечение информации из базы знаний для расширения подсказок, предоставляемых большим языковым моделям (LLM), тем самым повышая точность и надежность генерируемых ответов. Плохой поиск может привести к тому, что в LLM будет передаваться неточная или неполная информация, что приведет к ошибочным результатам и снижению доверия пользователей.
Сосредоточившись на оптимизации моделей встраивания и переранжирования, MongoDB стремится улучшить общую производительность и надежность приложений ИИ, которые полагаются на эффективный поиск данных. Доступность различных моделей Voyage 4 отвечает целому ряду вариантов использования, от приложений общего назначения до сред с ограниченными ресурсами. Открытый вес Voyage-4-nano также поощряет сотрудничество сообщества и инновации в области поиска данных для ИИ.
Разработка знаменует собой сдвиг в акцентах в ландшафте ИИ, признавая, что одних лишь достижений в размере модели недостаточно для гарантии надежных и точных систем ИИ. Вместо этого для создания надежных и эффективных корпоративных решений ИИ необходим целостный подход, учитывающий весь конвейер ИИ, включая поиск данных. Компания заявила, что модели уже доступны.
Discussion
Join the conversation
Be the first to comment