VentureBeatによると、PageIndexという新しいオープンソースフレームワークが、検索拡張生成(RAG)システムにおける長文ドキュメントの取り扱いという課題に対するソリューションを提供しており、ベクター検索が通常失敗するドキュメントで98.7%の精度を達成しています。一方、別のニュースでは、Ars Technicaが、ストーンヘンジの石は氷河ではなく、人間がウェールズとスコットランド北部から運んだという研究結果を報じています。
PageIndexは、ドキュメントをチャンクに分割し、埋め込みを計算し、ベクターデータベースに保存し、意味的類似性に基づいて上位一致を検索するという、従来のRAGワークフローで使用される標準的な「チャンクアンドエンベッド」方式を放棄していると、VentureBeatは指摘しています。代わりに、ドキュメント検索をナビゲーションの問題として扱います。このアプローチは、企業がRAGを財務諸表の監査、法的契約の分析、医薬品プロトコルのナビゲーションなど、リスクの高いワークフローに統合しようとする際に、精度上の障壁に遭遇しているため、特に関連性が高くなっています。
VentureBeatはまた、ドキュメントをフラットなテキスト文字列として扱い、固定サイズのチャンク分割を使用する標準的なRAGパイプラインの限界も強調しました。この方法は、散文には適していますが、表を分割したり、画像からキャプションを切り離したり、ページの視覚的な階層を無視したりすることで、技術マニュアルのロジックを混乱させる可能性があります。「失敗はLLMにあるのではなく、前処理にある」とVentureBeatは述べています。
別の展開として、Ars Technicaは、人間がウェールズとスコットランド北部からストーンヘンジに石を運んだという説を裏付ける新たな証拠を報じました。この研究は、象徴的な石を移動させたのは氷河ではなく、人間であったことを示唆しています。
さらに、Wiredは、レゴセット、デートボックス、花、ローブなど、バレンタインデーのギフトに関するガイダンスを提供しました。同誌はまた、デートナイトボックスをレビューし、あるライターはHingeをダウンロードしてデート相手を見つけた後、人気のオプション10個をテストしました。
Discussion
AI Experts & Community
Be the first to comment