MongoDB는 단순히 AI 모델을 확장하는 것보다 향상된 데이터 검색이 신뢰할 수 있는 엔터프라이즈 AI 시스템 구축에 중요하다고 믿습니다. 에이전트 시스템과 검색 증강 생성(RAG)이 프로덕션 환경에서 인기를 얻으면서, 이 데이터베이스 제공업체는 기본 AI 모델이 강력하더라도 검색 품질이 정확성, 비용 효율성 및 사용자 신뢰도에 부정적인 영향을 미칠 수 있는 중요한 병목 현상임을 확인했습니다.
이러한 문제를 해결하기 위해 MongoDB는 최근 Voyage 4로 알려진 임베딩 및 재정렬 모델의 네 가지 새로운 버전을 출시했습니다. 이 모델은 AI 애플리케이션 내에서 데이터 검색 프로세스의 정확성과 효율성을 향상시키도록 설계되었습니다. Voyage 4 제품군에는 범용 모델인 voyage-4 임베딩, MongoDB의 주력 모델로 간주되는 voyage-4-large, 낮은 지연 시간과 비용에 민감한 애플리케이션에 최적화된 voyage-4-lite, 로컬 개발, 테스트 및 온디바이스 데이터 검색을 위한 voyage-4-nano가 포함됩니다. Voyage-4-nano는 MongoDB가 오픈 웨이트 모델에 처음으로 진출한 모델입니다.
모든 Voyage 4 모델은 API와 MongoDB의 Atlas 플랫폼에서 액세스할 수 있습니다. 회사에 따르면 이러한 모델은 시장에서 유사한 제품보다 성능이 뛰어납니다.
검색 품질에 대한 강조는 에이전트 및 RAG 시스템의 성능이 관련 정보에 효율적이고 정확하게 액세스하는 능력에 크게 의존한다는 AI 커뮤니티 내의 인식이 높아지고 있음을 강조합니다. 특히 RAG 시스템은 대규모 언어 모델(LLM)에 제공되는 프롬프트를 보강하기 위해 지식 기반에서 정보를 검색하여 생성된 응답의 정확성과 신뢰성을 향상시킵니다. 검색 품질이 좋지 않으면 부정확하거나 불완전한 정보가 LLM에 제공되어 결함 있는 결과와 사용자 신뢰도 저하를 초래할 수 있습니다.
MongoDB는 임베딩 및 재정렬 모델 최적화에 집중함으로써 효율적인 데이터 검색에 의존하는 AI 애플리케이션의 전반적인 성능과 신뢰성을 향상시키는 것을 목표로 합니다. 다양한 Voyage 4 모델을 통해 범용 애플리케이션에서 리소스가 제한된 환경에 이르기까지 다양한 사용 사례를 충족할 수 있습니다. 또한 Voyage-4-nano의 오픈 웨이트 특성은 AI를 위한 데이터 검색 분야에서 커뮤니티 협업과 혁신을 장려합니다.
이 개발은 모델 크기만으로는 신뢰할 수 있고 정확한 AI 시스템을 보장하기에 충분하지 않다는 점을 인정하면서 AI 환경 내에서 초점의 변화를 의미합니다. 대신 데이터 검색을 포함한 전체 AI 파이프라인을 고려하는 전체적인 접근 방식이 신뢰할 수 있고 효과적인 엔터프라이즈 AI 솔루션 구축에 필수적입니다. 회사 측에 따르면 해당 모델은 현재 사용 가능합니다.
Discussion
대화에 참여하세요
첫 댓글을 남겨보세요