El café vence a la microdosificación, se avecina un hongo asesino y los sistemas RAG fallan

Las empresas lidian con las limitaciones de los sistemas RAG al manejar documentos complejos

Las empresas están adoptando cada vez más los sistemas de Generación Aumentada por Recuperación (RAG, por sus siglas en inglés) para aprovechar sus datos internos con los Modelos de Lenguaje Grandes (LLM, por sus siglas en inglés), pero muchas están descubriendo que estos sistemas tienen dificultades con documentos sofisticados, según VentureBeat. El problema radica principalmente en la etapa de preprocesamiento, donde las canalizaciones RAG estándar a menudo tratan los documentos como cadenas de texto planas, lo que lleva a la pérdida de información crucial.

Los sistemas RAG tienen como objetivo basar los LLM en datos propietarios, lo que permite a las empresas automatizar los flujos de trabajo, respaldar la toma de decisiones y operar de forma semiautónoma. Sin embargo, la dependencia de la "fragmentación de tamaño fijo", que implica cortar los documentos en segmentos arbitrarios, puede ser perjudicial cuando se trata de manuales técnicos y otros documentos complejos, informó VentureBeat. Este método separa los subtítulos de las imágenes, corta las tablas por la mitad y no tiene en cuenta la jerarquía visual de la página.

Según VentureBeat, el fallo no está en el LLM en sí, sino en la forma en que se preparan los documentos para el análisis. Dippu Kumar Singh escribió en VentureBeat que la promesa de indexar archivos PDF y democratizar instantáneamente el conocimiento corporativo ha sido decepcionante para las industrias que dependen de la ingeniería pesada. Los ingenieros que hacen preguntas específicas sobre la infraestructura han descubierto que el bot alucina las respuestas.

Varun Raj escribió en VentureBeat que los fallos en la recuperación se propagan directamente al riesgo empresarial una vez que se implementan los sistemas de IA. El contexto obsoleto, las rutas de acceso no controladas y las canalizaciones de recuperación mal evaluadas pueden socavar la confianza, el cumplimiento y la fiabilidad operativa, añadió Raj. Reformula la recuperación como infraestructura en lugar de lógica de aplicación.

Las limitaciones de los sistemas RAG actuales resaltan la necesidad de técnicas de preprocesamiento más sofisticadas que puedan preservar la estructura y el contexto de los documentos complejos. Mejorar la fiabilidad de RAG no se trata de ajustar el LLM; se trata de garantizar que el sistema comprenda los documentos que está procesando.

Share & Engage

AI Analysis

Discussion

More Stories

URGENTE: ¡El Departamento de Educación Despilfarró $28 Millones en Despidos de Personal, Advierte el Vigilante!

URGENTE: ¡El Departamento de Educación Despilfarró $28 Millones en Despidos de Personal, Advierte el Vigilante!

Turbulencia Global: Tragedia, Tormenta de Fuego y Bloqueo de Pornhub Sacuden al Mundo

Turbulencia Global: Tragedia, Tormenta de Fuego y Bloqueo de Pornhub Sacuden al Mundo

¡Conejo Rockea los Grammys, el Mundo Se Tambalea!

¡Conejo Rockea los Grammys, el Mundo Se Tambalea!

EN DESARROLLO: Se Derrumban las Conversaciones Sobre la ACA en el Senado; Se Asoma una Crisis de Salud

EN DESARROLLO: Se Derrumban las Conversaciones Sobre la ACA en el Senado; Se Asoma una Crisis de Salud

EN DESARROLLO: ¿Salvador IA? ¡Conejo Lavanda Rescata a Víctima de Accidente!

EN DESARROLLO: ¿Salvador IA? ¡Conejo Lavanda Rescata a Víctima de Accidente!

Universo más uniforme de lo esperado; ICE apunta a refugiados

Universo más uniforme de lo esperado; ICE apunta a refugiados

Robots Bailan, Bad Bunny Gana, y TikTok Regresa: ¡Las Noticias Más Importantes de Hoy!

Robots Bailan, Bad Bunny Gana, y TikTok Regresa: ¡Las Noticias Más Importantes de Hoy!

Puntos críticos globales: Protestas, fronteras y justicia en los titulares

Puntos críticos globales: Protestas, fronteras y justicia en los titulares

La sombra de Epstein: Gates lo niega, Amazon se beneficia, Irán se oscurece.

La sombra de Epstein: Gates lo niega, Amazon se beneficia, Irán se oscurece.

Alcaraz Hace Historia con Aces Mientras Liberan a Niño y la Música Lanza Curvas Peligrosas

Alcaraz Hace Historia con Aces Mientras Liberan a Niño y la Música Lanza Curvas Peligrosas

Lithgow Defiende su Papel de Potter en Medio de los Escándalos de Epstein y la Reconstrucción de Siria

Lithgow Defiende su Papel de Potter en Medio de los Escándalos de Epstein y la Reconstrucción de Siria

El Mundo de Trump: Caracas Cuestiona lo "Normal" Mientras la Base Desafía las Encuestas en Caída Libre

El Mundo de Trump: Caracas Cuestiona lo "Normal" Mientras la Base Desafía las Encuestas en Caída Libre