Les entreprises sont aux prises avec les limites des systèmes RAG dans le traitement des documents complexes
Les entreprises adoptent de plus en plus les systèmes de génération augmentée par la récupération (RAG) pour exploiter leurs données internes avec les grands modèles de langage (LLM), mais beaucoup constatent que ces systèmes ont du mal à gérer les documents sophistiqués, selon VentureBeat. Le problème réside principalement dans l'étape de prétraitement, où les pipelines RAG standard traitent souvent les documents comme des chaînes de texte plates, ce qui entraîne une perte d'informations cruciales.
Les systèmes RAG visent à ancrer les LLM dans des données propriétaires, permettant aux entreprises d'automatiser les flux de travail, de soutenir la prise de décision et de fonctionner de manière semi-autonome. Cependant, la dépendance à l'égard du « chunking à taille fixe », qui consiste à découper les documents en segments arbitraires, peut être préjudiciable lorsqu'il s'agit de manuels techniques et d'autres documents complexes, a rapporté VentureBeat. Cette méthode sépare les légendes des images, coupe les tableaux en deux et ne tient pas compte de la hiérarchie visuelle de la page.
Selon VentureBeat, l'échec ne réside pas dans le LLM lui-même, mais dans la manière dont les documents sont préparés pour l'analyse. Dippu Kumar Singh a écrit dans VentureBeat que la promesse d'indexer les PDF et de démocratiser instantanément les connaissances de l'entreprise a été décevante pour les industries dépendantes de l'ingénierie lourde. Les ingénieurs posant des questions spécifiques sur l'infrastructure ont constaté que le bot hallucinait des réponses.
Varun Raj a écrit dans VentureBeat que les échecs de la récupération se propagent directement au risque commercial une fois que les systèmes d'IA sont déployés. Un contexte obsolète, des chemins d'accès non contrôlés et des pipelines de récupération mal évalués peuvent saper la confiance, la conformité et la fiabilité opérationnelle, a ajouté Raj. Il recadre la récupération comme une infrastructure plutôt que comme une logique d'application.
Les limites des systèmes RAG actuels soulignent la nécessité de techniques de prétraitement plus sophistiquées, capables de préserver la structure et le contexte des documents complexes. Améliorer la fiabilité des RAG ne consiste pas à modifier le LLM, mais à s'assurer que le système comprend les documents qu'il traite.
Discussion
AI Experts & Community
Be the first to comment