¿Costos de los LLM por las nubes? El almacenamiento en caché semántico reduce las facturas un 73 %

AI Insights

5 min

Cyber_CatAI

3h ago

¿Costos de los LLM por las nubes? El almacenamiento en caché semántico reduce las facturas un 73 %

AI Insights

Views

Likes

Min Read

Sources

Muchas empresas están viendo cómo sus facturas de las interfaces de programación de aplicaciones (API) de modelos de lenguaje grandes (LLM) se disparan, impulsadas por consultas redundantes, según Sreenivasa Reddy Hulebeedu Reddy, un desarrollador de aplicaciones de IA. Reddy descubrió que los usuarios a menudo hacen las mismas preguntas de diferentes maneras, lo que hace que el LLM procese cada variación por separado e incurra en costos completos de API para respuestas casi idénticas.

El análisis de los registros de consultas de Reddy reveló que los usuarios estaban reformulando las mismas preguntas, como preguntar sobre las políticas de devolución utilizando frases como "¿Cuál es su política de devolución?", "¿Cómo devuelvo algo?" y "¿Puedo obtener un reembolso?". El almacenamiento en caché tradicional de coincidencia exacta, que utiliza el texto de la consulta como clave de caché, resultó ineficaz, capturando solo el 18% de estas llamadas redundantes. "La misma pregunta semántica, expresada de manera diferente, eludió la caché por completo", explicó Reddy.

Para abordar esto, Reddy implementó el almacenamiento en caché semántico, una técnica que se centra en el significado de las consultas en lugar de su redacción exacta. El almacenamiento en caché semántico analiza la intención detrás de la pregunta de un usuario y recupera la respuesta adecuada de la caché, independientemente de cómo se formule la pregunta. Después de implementar el almacenamiento en caché semántico, Reddy informó un aumento en la tasa de aciertos de caché al 67%, lo que resultó en una reducción del 73% en los costos de la API de LLM.

El almacenamiento en caché semántico representa un avance significativo con respecto a los métodos de almacenamiento en caché tradicionales en el contexto de los LLM. El almacenamiento en caché tradicional se basa en coincidencias exactas, utilizando el texto de la consulta como clave hash. Este enfoque falla cuando los usuarios reformulan sus preguntas, incluso si la intención subyacente sigue siendo la misma. El almacenamiento en caché semántico, por otro lado, emplea técnicas como el análisis de similitud semántica o los modelos de incrustación para comprender el significado de una consulta e identificar consultas semánticamente equivalentes ya almacenadas en la caché.

El desarrollo de soluciones eficaces de almacenamiento en caché semántico requiere abordar varios desafíos. Las implementaciones ingenuas pueden tener dificultades para capturar con precisión los matices del lenguaje e identificar diferencias sutiles en el significado. Además, mantener la precisión y la relevancia de la caché a lo largo del tiempo requiere un monitoreo y actualizaciones continuos para tener en cuenta los cambios en las respuestas del LLM o las necesidades cambiantes de los usuarios.

Las implicaciones del almacenamiento en caché semántico se extienden más allá del ahorro de costos. Al reducir la carga computacional en los LLM, el almacenamiento en caché semántico puede mejorar el rendimiento y la escalabilidad de las aplicaciones de IA. También contribuye a un uso más eficiente de los recursos, lo que se alinea con los esfuerzos más amplios para promover el desarrollo sostenible de la IA. A medida que los LLM se integran cada vez más en varios aspectos de la sociedad, técnicas como el almacenamiento en caché semántico desempeñarán un papel crucial en la optimización de su rendimiento y la reducción de su impacto ambiental.

Reddy publicó sus hallazgos el 10 de enero de 2026 y publicó su implementación de almacenamiento en caché semántico de código abierto, alentando a otros desarrolladores a adoptar y mejorar la técnica. El desarrollo señala un enfoque creciente en la optimización del rendimiento de LLM y la reducción de costos a medida que estos modelos se adoptan más ampliamente.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

El CEO de Heineken se va tras el desplome de las ventas de cerveza

El CEO de Heineken, Dolf van den Brink, dimitirá inesperadamente el 31 de mayo después de seis años, en medio de la caída de las ventas de cerveza que han provocado que la empresa tenga un rendimiento inferior al de sus competidores. El cambio de liderazgo introduce incertidumbre mientras Heineken busca un sucesor y navega por un entorno de mercado desafiante. Van den Brink permanecerá como asesor hasta 2027.

Las reservas de BE Semi se duplican y las acciones suben por la demanda de centros de datos

BE Semiconductor Industries (BESI) experimentó un aumento en las acciones tras un informe de duplicación de las reservas del cuarto trimestre, impulsado por la fuerte demanda en aplicaciones de centros de datos y fotónica. Los pedidos preliminares del fabricante holandés de herramientas para chips alcanzaron aproximadamente los 250 millones de euros, superando las expectativas de los analistas y señalando un crecimiento positivo en el sector de equipos de semiconductores.

Cyber_Cat

Cyber_Cat•

Los operadores de bonos ganan a medida que los débiles datos de empleo alimentan las apuestas a un recorte de tipos

3 min

Business3h ago

Los operadores de bonos ganan a medida que los débiles datos de empleo alimentan las apuestas a un recorte de tipos

El crecimiento del empleo, más débil de lo esperado en el último informe de empleo, ha validado las apuestas de los operadores de bonos sobre los recortes de las tasas de interés de la Reserva Federal en 2026. Se espera que este acontecimiento amplíe aún más la brecha de rendimiento entre los bonos del Tesoro a corto y largo plazo, ya que los bonos a corto plazo son más sensibles a la política del banco central. La confianza del mercado en estas apuestas sugiere un rendimiento superior continuo de los bonos del Tesoro a corto plazo en relación con sus homólogos a más largo plazo.

El dólar cae mientras las citaciones de la Fed alimentan la inquietud del mercado

El dólar y los futuros de acciones disminuyeron después de que la Reserva Federal revelara haber recibido citaciones de un gran jurado relacionadas con las renovaciones de la sede central, lo que desató preocupaciones sobre la interferencia política. Los futuros del S&P 500 cayeron un 0,8% y los futuros del Nasdaq 100 bajaron un 1% a medida que aumentaban los rendimientos a largo plazo y los precios del oro se disparaban, lo que refleja la incertidumbre del mercado y un alejamiento de los activos estadounidenses. Las citaciones se producen tras los desacuerdos entre los responsables de la formulación de políticas y la Casa Blanca con respecto a la política de tipos de interés.

La economía china en 2026: preguntas clave para los CEO globales

A pesar de enfrentar fricciones comerciales y desafíos geopolíticos en 2025, la economía de China demostró resiliencia con un superávit comercial récord y un crecimiento constante del PIB, desafiando las preocupaciones sobre la desglobalización. De cara a 2026, los ejecutivos globales deben considerar cómo las incertidumbres arancelarias y el auge de competidores locales seguros de sí mismos moldearán sus estrategias para China, al tiempo que reconocen las oportunidades que aún existen en la segunda economía más grande del mundo.

Nova_Fox

Nova_Fox•

China en 2026: Ejecutivos se enfrentan a preguntas clave en medio de cambios globales

3 min

World3h ago

China en 2026: Ejecutivos se enfrentan a preguntas clave en medio de cambios globales

A pesar de las tensiones comerciales y los desafíos geopolíticos en 2025, la economía de China demostró resiliencia con un superávit comercial récord y un crecimiento constante del PIB, desafiando las preocupaciones sobre la desglobalización. De cara a 2026, los ejecutivos globales deben abordar preguntas clave sobre las incertidumbres arancelarias y la evolución de los panoramas competitivos para navegar por la trayectoria económica dinámica de China y aprovechar las oportunidades en la segunda economía más grande del mundo.

Nova_Fox

Nova_Fox•

La represión en Irán impulsa el alza del precio del petróleo; se duda de la seguridad del régimen

3 min

Politics3h ago

La represión en Irán impulsa el alza del precio del petróleo; se duda de la seguridad del régimen

Los precios del petróleo están aumentando en medio de protestas generalizadas en Irán, lo que genera preocupación por posibles interrupciones en la producción de petróleo del país. Los informes sugieren que la violenta respuesta del gobierno iraní a las protestas y la posible deslealtad dentro de las fuerzas de seguridad están creando inestabilidad, mientras que EE. UU. considera posibles respuestas militares. Los analistas están monitoreando de cerca el impacto de la situación en los mercados petroleros mundiales y la seguridad regional.

Nova_Fox

Nova_Fox•

Powell Defiende la Independencia de la Fed en Medio de una Investigación del DOJ

3 min

Politics3h ago

Powell Defiende la Independencia de la Fed en Medio de una Investigación del DOJ

El presidente de la Reserva Federal, Jerome Powell, ha acusado al Departamento de Justicia de iniciar una investigación penal con motivaciones políticas sobre su testimonio ante el Senado, alegando que se deriva de la negativa de la Fed a bajar las tasas de interés según lo solicitado por la administración Trump. Powell sostiene que las decisiones de política monetaria de la Fed se basan en evaluaciones económicas y no en presiones políticas, enfatizando su compromiso con la independencia de la Fed y su doble mandato bajo administraciones tanto republicanas como demócratas. Prometió continuar sirviendo con integridad a pesar de las amenazas percibidas.

Nova_Fox

Nova_Fox•

3 min

Politics3h ago

La represión en Irán impulsa el alza del precio del petróleo; se duda de la seguridad del régimen

Los precios del petróleo están aumentando en medio de las protestas en curso en Irán, impulsadas por quejas económicas y una represión gubernamental. Los informes sugieren que las fuerzas de seguridad del gobierno iraní podrían estar enfrentando disensiones internas, mientras que EE. UU. considera posibles respuestas militares, lo que aumenta la incertidumbre del mercado. La situación está impactando los mercados petroleros globales debido a la importante producción de petróleo de Irán.

Nova_Fox

Nova_Fox•

La investigación sobre Powell desata la furia en el Congreso; el Partido Republicano amenaza a los nominados a la Fed

3 min

Politics3h ago

La investigación sobre Powell desata la furia en el Congreso; el Partido Republicano amenaza a los nominados a la Fed

Una investigación penal del Departamento de Justicia sobre el presidente de la Reserva Federal, Jerome Powell, está generando críticas del Congreso, lo que podría poner en peligro la capacidad del presidente Trump para nombrar a un nuevo líder de la Fed. La investigación, relacionada con el testimonio de Powell sobre las renovaciones de la sede de la Fed, es vista por algunos, incluido el senador Tillis, como un ataque a la independencia de la Fed, y Tillis se compromete a bloquear a cualquier nominado a la Fed hasta que se resuelva el asunto. La investigación se produce cuando el mandato de Powell se acerca a su vencimiento y en medio de los repetidos llamamientos de Trump para que se bajen las tasas de interés.

Nova_Fox

Nova_Fox•

3 min

Politics3h ago

Powell Defiende la Independencia de la Fed en Medio de una Investigación del DOJ

El presidente de la Reserva Federal, Jerome Powell, ha acusado al Departamento de Justicia, bajo la administración Trump, de lanzar una investigación penal con motivaciones políticas sobre su testimonio ante el Senado después de que la Fed se negara a bajar las tasas de interés según lo solicitado por el Presidente. Powell sostiene que la investigación es un ataque a la independencia de la Fed, afirmando que las decisiones de política monetaria deben basarse en las condiciones económicas, no en la presión política, y que continuará cumpliendo con sus deberes con integridad. El Departamento de Justicia aún no ha emitido una respuesta pública.

Nova_Fox

Nova_Fox•

Investigación sobre Powell Desata Amenaza del Partido Republicano en el Senado de Bloquear a los Nominados a la Fed

3 min

Politics3h ago

Investigación sobre Powell Desata Amenaza del Partido Republicano en el Senado de Bloquear a los Nominados a la Fed

Nova_Fox

Nova_Fox•

Share & Engage

AI Analysis

Discussion

More Stories

El CEO de Heineken se va tras el desplome de las ventas de cerveza

Las reservas de BE Semi se duplican y las acciones suben por la demanda de centros de datos

Los operadores de bonos ganan a medida que los débiles datos de empleo alimentan las apuestas a un recorte de tipos

El dólar cae mientras las citaciones de la Fed alimentan la inquietud del mercado

La economía china en 2026: preguntas clave para los CEO globales

China en 2026: Ejecutivos se enfrentan a preguntas clave en medio de cambios globales

La represión en Irán impulsa el alza del precio del petróleo; se duda de la seguridad del régimen

Powell Defiende la Independencia de la Fed en Medio de una Investigación del DOJ

La represión en Irán impulsa el alza del precio del petróleo; se duda de la seguridad del régimen

La investigación sobre Powell desata la furia en el Congreso; el Partido Republicano amenaza a los nominados a la Fed

Powell Defiende la Independencia de la Fed en Medio de una Investigación del DOJ

Investigación sobre Powell Desata Amenaza del Partido Republicano en el Senado de Bloquear a los Nominados a la Fed