VentureBeatによると、企業はRetrieval-Augmented Generation(RAG)システムにおいて課題に直面しており、標準的な前処理方法では複雑なドキュメントを適切に処理できないことが多いという。検索の失敗は、信頼性、コンプライアンス、および運用上の信頼性に関連するビジネスリスクにつながる可能性があり、鮮度、ガバナンス、および評価を優先する検索プラットフォームの設計に対するシステムレベルのアプローチが必要となる。
VentureBeatによると、多くの企業が何らかの形でRAGを導入し、PDFをインデックス化し、大規模言語モデル(LLM)を接続して、企業知識を即座に民主化することを期待している。しかし、重工業に依存する業界では、エンジニアがインフラストラクチャに関する具体的な質問をすると、ボットが幻覚を見るなど、期待外れの結果となっている。
VentureBeatの報道によると、問題はLLMにあるのではなく、前処理にある。標準的なRAGパイプラインは、ドキュメントをテキストのフラットな文字列として扱い、「固定サイズチャンキング」(ドキュメントを500文字ごとにカットする)を使用する。これは散文には有効だが、技術マニュアルのロジックを破壊し、表を半分に切り、キャプションを画像から切り離し、ページの視覚的な階層を無視する。
その他の技術ニュースとして、Hacker Newsによると、複数の情報源が、Xteink X4電子書籍リーダーやAI搭載のノートテイカーなどの技術ガジェットを含む、さまざまなトピックについて報道している。インドネシアは、合意なしの画像生成に関する懸念が解消された後、xAIのGrokチャットボットに対する禁止を条件付きで解除した。サービス業界における自動化も増加しており、シアトルのロボットバリスタJarvisがその例である。
一方、Nature Newsによると、科学者は略奪的な学術誌や会議に注意するよう警告されている。革新的なツールであるAletheia-Probeは、学術誌や会議の評価を簡単に確認する方法を提供し、ユーザーは信頼できるものをより適切に評価できる。科学者は、自分の作品を学術誌や会議に投稿するように誘うお世辞のメールを頻繁に受け取るが、それらは粗末なサービスと引き換えにお金を受け取ることを喜んでいる。これらの出版物は、査読プロセスを省略したり、数か月後に消滅したりする可能性があり、会議は空っぽの会議室で構成されている可能性がある。
エンターテインメントニュースでは、Timeによると、HBOの金融ドラマ「Industry」が、その境界線を押し広げるストーリーテリングで注目を集めている。現在シーズン4を迎えたこのシリーズは、ロンドンの取引所のルーツを捨て、権力、階級、ジェンダー、人種、そして個人の道徳をより広範に探求している。
Discussion
AI Experts & Community
Be the first to comment