MongoDBは、信頼できるエンタープライズAIシステムを構築するためには、単に大規模なAIモデルを構築するだけでなく、データ検索の改善が不可欠であると考えています。エージェントシステムやRetrieval-Augmented Generation(RAG)が本番環境で普及するにつれて、同データベースプロバイダーは、基盤となるAIモデルが堅牢であっても、検索品質が精度、費用対効果、およびユーザーの信頼性に悪影響を与える可能性のある重大なボトルネックであることを特定しました。
この課題に対処するため、MongoDBは最近、Voyage 4として知られる、embeddingsおよびrerankingモデルの4つの新しいバージョンをリリースしました。これらのモデルは、AIアプリケーションにおけるデータ検索の精度と効率を向上させるように設計されています。Voyage 4ファミリーには、汎用モデルであるvoyage-4 embedding、フラッグシップモデルと見なされるvoyage-4-large、低レイテンシーおよびコスト重視のアプリケーション向けに最適化されたvoyage-4-lite、およびローカル開発、テスト、およびオンデバイスデータ検索を目的としたvoyage-4-nanoが含まれています。Voyage-4-nanoは、MongoDB初のオープンウェイトモデルとなります。
すべてのVoyage 4モデルは、APIおよびMongoDBのAtlasプラットフォーム上でアクセス可能です。MongoDBによると、これらのモデルは検索品質において同等のモデルよりも優れています。
検索品質の重視は、AIシステムの有効性はモデル自体の能力だけでなく、関連情報に効率的にアクセスして処理する能力にもかかっているという、AIコミュニティ内での理解の高まりを浮き彫りにしています。たとえば、RAGシステムは、応答を生成する前に、大規模言語モデル(LLM)の知識を補強するために、関連するドキュメントまたはデータスニペットの検索に依存しています。検索コンポーネントが弱い場合、LLMには不正確または不完全な情報が供給され、最適とは言えない結果につながる可能性があります。
自律的にタスクを実行するように設計されたエージェントシステムも、情報に基づいた意思決定を行い、適切なアクションを実行するために、信頼性の高いデータ検索に依存しています。これらのシステムにおける検索品質の低下は、エラー、非効率性、さらには潜在的に有害な結果につながる可能性があります。
MongoDBのembeddingsおよびrerankingモデルへの注力は、データ取り込みからモデル展開までのAIパイプライン全体の最適化に向けたトレンドを反映しています。データ検索の精度と効率を向上させることで、企業は具体的なビジネス価値を提供する、より信頼性が高く効果的なAIシステムを構築できます。これらのモデルをAPIおよびAtlasプラットフォームを通じて利用できることで、AI機能を強化しようとしている開発者や組織にとって統合が簡素化されます。同社は、これらのモデルが同様のモデルよりも優れていると述べています。
Discussion
Join the conversation
Be the first to comment