MongoDB считает, что улучшенный поиск данных, а не просто более крупные модели ИИ, имеет решающее значение для создания надежных корпоративных систем ИИ. Поскольку системы, управляемые агентами, и Retrieval-Augmented Generation (RAG) набирают обороты в производственной среде, поставщик баз данных определил качество поиска как значительную, часто упускаемую из виду, слабость. Эта слабость, по мнению MongoDB, может негативно повлиять на точность, экономическую эффективность и доверие пользователей, даже если базовые модели ИИ работают оптимально.
Чтобы решить эту проблему, MongoDB недавно выпустила четыре новые версии своих моделей эмбеддингов и переранжирования, известные под общим названием Voyage 4. Эти модели предназначены для повышения эффективности и точности поиска данных в приложениях ИИ. Семейство Voyage 4 включает voyage-4 embedding, модель общего назначения; voyage-4-large, считающуюся флагманской моделью; voyage-4-lite, оптимизированную для задач с низкой задержкой и чувствительных к стоимости; и voyage-4-nano, предназначенную для локальной разработки, тестирования и поиска данных на устройстве. Примечательно, что voyage-4-nano — первая модель MongoDB с открытым весом.
Все модели Voyage 4 доступны через API и на платформе Atlas от MongoDB. Компания утверждает, что эти модели превосходят сопоставимые модели на рынке.
Акцент на качестве поиска подчеркивает растущую обеспокоенность в сообществе ИИ. В то время как большое внимание уделяется разработке все более крупных и сложных моделей ИИ, способность эффективно и точно извлекать релевантные данные часто является узким местом. Системы RAG, например, полагаются на извлечение информации из базы знаний для расширения ответов, генерируемых большой языковой моделью (LLM). Если процесс извлечения данных несовершенен, LLM может получать неточную или неполную информацию, что приведет к плохим результатам.
Системы, управляемые агентами, которые предназначены для автономного выполнения задач, также зависят от надежного поиска данных для принятия обоснованных решений. Низкое качество поиска может привести к тому, что агенты будут делать неправильный выбор или не смогут эффективно выполнить свои задачи.
Направленность MongoDB на модели эмбеддингов и переранжирования направлена на повышение точности и эффективности процесса поиска. Модели эмбеддингов преобразуют текст или другие данные в числовые представления, которые отражают семантическое значение. Эти представления затем можно использовать для быстрого определения релевантных данных на основе сходства. Модели переранжирования дополнительно уточняют результаты, определяя приоритетность наиболее релевантных элементов.
Доступность этих моделей через API и на платформе Atlas делает их доступными для широкого круга разработчиков и организаций. Открытый вес voyage-4-nano также обеспечивает большую гибкость и возможности настройки.
Разработка знаменует собой сдвиг в акцентах в индустрии ИИ, признавая, что для надежного ИИ требуются не только мощные модели, но и надежные механизмы поиска данных. Успех моделей Voyage 4 от MongoDB может иметь значительные последствия для будущего корпоративного ИИ, потенциально приводя к более точным, экономически эффективным и надежным приложениям ИИ.
Discussion
Join the conversation
Be the first to comment