MongoDB는 단순히 더 큰 AI 모델보다는 향상된 데이터 검색이 신뢰할 수 있는 엔터프라이즈 AI 시스템 구축에 중요하다고 믿습니다. 에이전트 시스템과 검색 증강 생성(RAG)이 프로덕션 환경으로 이동함에 따라, 데이터베이스 제공업체는 기본 AI 모델이 최적으로 작동하더라도 검색 품질이 정확성, 비용 효율성 및 사용자 신뢰에 부정적인 영향을 미칠 수 있는 중요한 약점이라고 판단했습니다.
이 문제를 해결하기 위해 MongoDB는 Voyage 4로 알려진 임베딩 및 재정렬 모델의 새로운 버전 4개를 출시했습니다. 이 모델들은 AI 애플리케이션에서 데이터 검색의 효율성과 정확성을 향상시키도록 설계되었습니다. Voyage 4 제품군에는 범용 모델인 voyage-4 embedding, MongoDB의 주력 모델로 간주되는 voyage-4-large, 낮은 지연 시간과 비용에 민감한 애플리케이션에 최적화된 voyage-4-lite, 로컬 개발, 테스트 및 온디바이스 데이터 검색을 위한 voyage-4-nano가 포함됩니다. Voyage-4-nano는 MongoDB의 첫 번째 오픈 웨이트 모델이기도 합니다.
모든 Voyage 4 모델은 API와 MongoDB의 Atlas 플랫폼에서 액세스할 수 있습니다. MongoDB에 따르면, 이 모델들은 시장의 유사한 모델보다 성능이 뛰어납니다.
검색 품질에 대한 강조는 AI 커뮤니티 내에서 증가하는 우려를 강조합니다. 많은 관심이 대규모 언어 모델(LLM)의 기능에 집중되어 있지만, 이러한 모델의 효과는 모델이 수신하는 데이터의 품질에 크게 좌우됩니다. 예를 들어 RAG 시스템은 LLM의 응답을 보강하기 위해 데이터베이스 또는 지식 기반에서 관련 정보를 검색하는 데 의존합니다. 검색 프로세스에 결함이 있는 경우 LLM은 부정확하거나 관련 없는 출력을 생성하여 전체 시스템의 신뢰성을 저해할 수 있습니다.
자율적으로 작업을 수행하도록 설계된 에이전트 시스템 또한 정보에 입각한 결정을 내리기 위해 정확한 데이터 검색에 의존합니다. 낮은 검색 품질은 오류, 비효율성 및 시스템 기능에 대한 신뢰 부족으로 이어질 수 있습니다.
MongoDB가 임베딩 및 재정렬 모델에 집중하는 것은 데이터 검색의 정확성과 효율성을 개선하기 위한 전략을 반영합니다. 임베딩 모델은 데이터의 의미론적 관계를 포착하는 숫자 표현으로 데이터를 변환하여 보다 정확한 유사성 검색을 가능하게 합니다. 재정렬 모델은 가장 관련성이 높은 정보를 우선 순위로 지정하여 검색 결과를 더욱 개선합니다.
다양한 Voyage 4 모델의 가용성은 범용 애플리케이션에서 낮은 지연 시간 또는 온디바이스 처리가 필요한 특수 작업에 이르기까지 다양한 사용 사례를 충족합니다. 오픈 웨이트 모델인 Voyage-4-nano의 릴리스는 투명성과 커뮤니티 협업에 대한 약속을 나타내기도 합니다.
이 개발은 AI 시대에 강력한 데이터 인프라의 중요성을 강조합니다. AI 시스템이 엔터프라이즈 워크플로에 더욱 통합됨에 따라 안정적이고 효율적인 데이터 검색에 대한 필요성은 계속 증가할 것입니다. MongoDB의 최신 제품은 이러한 중요한 요구 사항을 해결하고 보다 신뢰할 수 있고 효과적인 AI 애플리케이션 개발에 기여하는 것을 목표로 합니다.
Discussion
대화에 참여하세요
첫 댓글을 남겨보세요