MongoDBは、信頼できるエンタープライズAIシステムを構築するためには、単にAIモデルをスケールアップするのではなく、データ検索の改善が重要であると考えています。エージェントシステムとRetrieval-Augmented Generation(RAG)が本番環境で普及するにつれて、同データベースプロバイダーは、基盤となるAIモデルが堅牢であっても、検索品質が精度、費用対効果、およびユーザーの信頼性に悪影響を与える可能性のある重大なボトルネックであると認識しました。
この課題に対処するため、MongoDBは最近、Voyage 4として知られるembeddingsおよびrerankingモデルの4つの新しいバージョンをリリースしました。これらのモデルは、AIアプリケーション内のデータ検索プロセスの精度と有効性を高めるように設計されています。Voyage 4ファミリーには、汎用モデルであるvoyage-4 embedding、MongoDBの主力モデルと見なされるvoyage-4-large、低レイテンシーおよびコスト重視のアプリケーション向けに最適化されたvoyage-4-lite、ローカル開発、テスト、およびオンデバイスデータ検索を目的としたvoyage-4-nanoが含まれます。Voyage-4-nanoは、MongoDB初のオープンウェイトモデルとなります。
すべてのVoyage 4モデルは、APIおよびMongoDBのAtlasプラットフォーム上でアクセス可能です。同社によると、これらのモデルは市場の類似製品よりも優れています。
検索品質の重視は、エージェントシステムおよびRAGシステムのパフォーマンスが、関連情報に効率的かつ正確にアクセスする能力に大きく依存しているというAIコミュニティ内の認識の高まりを浮き彫りにしています。特にRAGシステムは、大規模言語モデル(LLM)に与えられるプロンプトを強化するために、知識ベースから情報を検索することに依存しており、それによって生成される応答の精度と信頼性を向上させます。検索が不十分だと、不正確または不完全な情報がLLMに供給され、その結果、欠陥のある出力とユーザーの信頼の低下につながる可能性があります。
MongoDBは、embeddingsおよびrerankingモデルの最適化に焦点を当てることで、効率的なデータ検索に依存するAIアプリケーションの全体的なパフォーマンスと信頼性を向上させることを目指しています。さまざまなVoyage 4モデルの利用可能性は、汎用アプリケーションからリソース制約のある環境まで、幅広いユースケースに対応します。Voyage-4-nanoのオープンウェイトな性質は、AIのデータ検索分野におけるコミュニティのコラボレーションとイノベーションも促進します。
この開発は、モデルサイズの進歩だけでは、信頼性が高く正確なAIシステムを保証するには不十分であることを認識し、AIの状況における焦点の転換を示しています。代わりに、データ検索を含むAIパイプライン全体を考慮した全体的なアプローチが、信頼性が高く効果的なエンタープライズAIソリューションを構築するために不可欠です。同社によると、これらのモデルは現在利用可能です。
Discussion
Join the conversation
Be the first to comment