MongoDB считает, что улучшенный поиск данных, а не просто более крупные модели ИИ, имеет решающее значение для построения надежных корпоративных систем ИИ. По мере того как агентные системы и Retrieval-Augmented Generation (RAG) переходят в производственную среду, поставщик баз данных определил качество поиска как существенный недостаток, который может негативно повлиять на точность, экономическую эффективность и доверие пользователей, даже когда базовые модели ИИ работают оптимально.
Чтобы решить эту проблему, MongoDB запустила четыре новые версии своих моделей эмбеддингов и переранжирования, известные под общим названием Voyage 4. Эти модели предназначены для повышения эффективности и точности поиска данных в приложениях ИИ. Семейство Voyage 4 включает voyage-4 embedding, модель общего назначения; voyage-4-large, считающуюся флагманской моделью MongoDB; voyage-4-lite, оптимизированную для приложений с низкой задержкой и чувствительных к стоимости; и voyage-4-nano, предназначенную для локальной разработки, тестирования и поиска данных на устройстве. Voyage-4-nano также является первой моделью MongoDB с открытым весом.
Все модели Voyage 4 доступны через API и на платформе Atlas от MongoDB. По данным MongoDB, эти модели превосходят сопоставимые модели на рынке.
Акцент на качестве поиска подчеркивает растущую обеспокоенность в сообществе ИИ. В то время как большое внимание уделяется возможностям больших языковых моделей (LLM), эффективность этих моделей в значительной степени зависит от качества получаемых ими данных. Системы RAG, например, полагаются на извлечение релевантной информации из базы данных или базы знаний для расширения ответов LLM. Если процесс извлечения данных несовершенен, LLM может генерировать неточные или нерелевантные результаты, подрывая надежность всей системы.
Агентные системы, которые предназначены для автономного выполнения задач, также зависят от точного извлечения данных для принятия обоснованных решений. Низкое качество поиска может привести к ошибкам, неэффективности и отсутствию доверия к возможностям системы.
Внимание MongoDB к моделям эмбеддингов и переранжирования отражает стратегию повышения точности и эффективности поиска данных. Модели эмбеддингов преобразуют данные в числовые представления, которые отражают семантические отношения, что позволяет выполнять более точный поиск по сходству. Модели переранжирования дополнительно уточняют результаты поиска, приоритизируя наиболее релевантную информацию.
Доступность различных моделей Voyage 4 отвечает целому ряду вариантов использования, от приложений общего назначения до специализированных задач, требующих низкой задержки или обработки на устройстве. Выпуск модели с открытым весом, Voyage-4-nano, также сигнализирует о приверженности прозрачности и сотрудничеству с сообществом.
Разработка подчеркивает важность надежной инфраструктуры данных в эпоху ИИ. По мере того как системы ИИ все больше интегрируются в корпоративные рабочие процессы, потребность в надежном и эффективном извлечении данных будет только расти. Последние предложения MongoDB направлены на удовлетворение этой критической потребности и содействие разработке более надежных и эффективных приложений ИИ.
Discussion
Join the conversation
Be the first to comment