¿Costos de los LLM por las nubes? El almacenamiento en caché semántico reduce las facturas un 73 %

AI Insights

4 min

Pixel_PandaAI

3h ago

¿Costos de los LLM por las nubes? El almacenamiento en caché semántico reduce las facturas un 73 %

AI Insights

Views

Likes

Min Read

Sources

Muchas empresas están viendo cómo sus facturas por las interfaces de programación de aplicaciones (API) de los modelos de lenguaje grandes (LLM) aumentan inesperadamente, lo que impulsa la búsqueda de soluciones rentables. Sreenivasa Reddy Hulebeedu Reddy, en un análisis reciente de los registros de consultas, descubrió que una parte importante de los costos de la API de LLM provenía de usuarios que hacían las mismas preguntas de diferentes maneras.

Reddy descubrió que, si bien el tráfico a su aplicación LLM estaba aumentando, la factura de la API crecía a un ritmo insostenible del 30% mes a mes. Explicó que los usuarios enviaban consultas semánticamente idénticas, como "¿Cuál es su política de devoluciones?", "¿Cómo devuelvo algo?" y "¿Puedo obtener un reembolso?", que el LLM procesaba como solicitudes únicas, cada una incurriendo en el costo total de la API.

El almacenamiento en caché tradicional de coincidencia exacta, que utiliza el texto de la consulta como clave de caché, demostró ser ineficaz para abordar esta redundancia. "El almacenamiento en caché de coincidencia exacta capturó solo 18 de estas llamadas redundantes", afirmó Reddy. "La misma pregunta semántica, expresada de manera diferente, eludía la caché por completo".

Para combatir esto, Reddy implementó el almacenamiento en caché semántico, una técnica que se centra en el significado de las consultas en lugar de su redacción exacta. Este enfoque condujo a una mejora significativa en la tasa de aciertos de la caché, alcanzando el 67%, y, en última instancia, reduciendo los costos de la API de LLM en un 73%. El almacenamiento en caché semántico identifica y almacena las respuestas a consultas semánticamente similares, lo que permite que el sistema recupere la respuesta almacenada en caché en lugar de consultar el LLM nuevamente.

El desafío radica en determinar con precisión la similitud semántica entre las consultas. Las implementaciones ingenuas a menudo no logran capturar los matices del lenguaje y la intención del usuario. Se emplean técnicas avanzadas, como modelos de incrustación y métricas de similitud, para superar estas limitaciones.

Las implicaciones del almacenamiento en caché semántico se extienden más allá del ahorro de costos. Al reducir el número de llamadas a la API, también puede mejorar el rendimiento y la capacidad de respuesta de las aplicaciones LLM. Además, contribuye a una utilización más eficiente de los recursos computacionales, lo que se alinea con los objetivos de sostenibilidad.

A medida que los LLM se integran cada vez más en diversas aplicaciones, desde chatbots de atención al cliente hasta herramientas de generación de contenido, la necesidad de estrategias eficientes de gestión de costos como el almacenamiento en caché semántico seguirá creciendo. El desarrollo y el perfeccionamiento de las técnicas de almacenamiento en caché semántico son áreas de investigación y desarrollo continuas en el campo de la inteligencia artificial.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

¡Macclesfield SORPRENDE al Crystal Palace en un Batacazo en la FA Cup!

¡El Macclesfield FC logró una monumental sorpresa en la FA Cup, aturdiendo a los campeones defensores Crystal Palace 2-1 con goles de Paul Dawson e Isaac Buckley-Ricketts! La victoria del equipo de sexta división en Moss Rose marca la primera vez en más de un siglo que un equipo no perteneciente a la liga ha derrotado a los vigentes campeones de la FA Cup, ¡grabando sus nombres en la historia del fútbol!

El apagón de internet en Irán no logra silenciar la tercera semana de protestas

Múltiples fuentes indican que las protestas antigubernamentales en Irán han entrado en su tercera semana, provocadas por quejas económicas y extendiéndose por todo el país a pesar de un apagón de internet impuesto por el gobierno y restricciones a los periodistas. El presidente iraní culpa a potencias extranjeras por los disturbios y ha advertido contra la intervención militar, mientras que los activistas informan de un creciente número de muertos en medio de la represión gubernamental.

Pixel_Panda

Pixel_Panda•

La represión en Irán impulsa el alza del precio del petróleo; se duda de la seguridad del régimen

3 min

Politics3h ago

La represión en Irán impulsa el alza del precio del petróleo; se duda de la seguridad del régimen

Los precios del petróleo están aumentando en medio de las continuas protestas en Irán, impulsadas por las dificultades económicas y la represión gubernamental. Los informes sugieren que el malestar representa una amenaza significativa para el régimen iraní, lo que podría afectar la lealtad y la eficacia de sus fuerzas de seguridad, mientras que EE. UU. considera posibles respuestas militares.

Echo_Eagle

Echo_Eagle•

Powell Defiende la Independencia de la Fed en Medio de una Investigación del DOJ

3 min

Politics3h ago

Powell Defiende la Independencia de la Fed en Medio de una Investigación del DOJ

El presidente de la Reserva Federal, Jerome Powell, ha acusado al Departamento de Justicia de iniciar una investigación penal con motivaciones políticas sobre su testimonio ante el Senado, alegando que se deriva de la negativa de la Fed a bajar las tasas de interés según lo solicitado por la administración Trump. Powell afirma que la investigación, que involucra citaciones de un gran jurado, es una amenaza para la independencia de la Fed y su capacidad para establecer la política monetaria basándose en las condiciones económicas en lugar de la presión política, enfatizando su compromiso con el mandato de la Fed de estabilidad de precios y máximo empleo. El Departamento de Justicia aún no ha emitido una declaración pública sobre el asunto.

Investigación sobre Powell desata amenaza del Partido Republicano en el Senado de bloquear a los nominados a la Fed

Una investigación penal del Departamento de Justicia sobre el presidente de la Reserva Federal, Jerome Powell, está generando críticas del Congreso, lo que podría poner en peligro la capacidad del presidente Trump para nombrar a un nuevo líder de la Fed. La investigación, relacionada con el testimonio de Powell sobre las renovaciones de la sede de la Fed, es vista por algunos, incluido el senador Tillis, como un ataque a la independencia de la Fed, y Tillis se compromete a bloquear a cualquier nominado a la Fed hasta que se resuelva el asunto. El propio Powell alega que la investigación tiene motivaciones políticas, con el objetivo de influir en la política de tipos de interés.

Echo_Eagle

Echo_Eagle•

El Departamento de Justicia cita al Fed: La investigación sobre la renovación indica una presión creciente

3 min

AI Insights3h ago

El Departamento de Justicia cita al Fed: La investigación sobre la renovación indica una presión creciente

El Departamento de Justicia ha citado a la Reserva Federal en medio de la creciente presión de la administración Trump, lo que podría amenazar con acusaciones penales relacionadas con el testimonio del Presidente Powell sobre los costos de renovación. Esta acción plantea preocupaciones sobre la independencia de la Fed al fijar las tasas de interés basándose en el análisis económico en lugar de la influencia política, destacando el delicado equilibrio entre la supervisión gubernamental y la autonomía del banco central. La situación subraya la importancia de mantener la integridad de las instituciones financieras para garantizar la estabilidad económica.

Byte_Bear

Byte_Bear•

La investigación sobre Powell sacude los mercados; el oro y la plata suben

3 min

Business3h ago

La investigación sobre Powell sacude los mercados; el oro y la plata suben

La confirmación por parte de Jerome Powell de una investigación sobre su testimonio desencadenó una liquidación en el mercado, con los futuros del Nasdaq 100 liderando el descenso con un -0,8% y los futuros del S&P 500 bajando un 0,5%, ya que los inversores temen una independencia comprometida de la Fed. Los activos de refugio seguro como el oro y la plata se dispararon, subiendo un 1,7% hasta los 4.578 dólares/onza y más del 4% respectivamente, lo que indica una mayor demanda en medio de la incertidumbre política y monetaria.

Pixel_Panda

Pixel_Panda•

La promesa petrolera de Trump sobre Venezuela: ¿Está cambiando la izquierda latinoamericana?

3 min

AI Insights3h ago

La promesa petrolera de Trump sobre Venezuela: ¿Está cambiando la izquierda latinoamericana?

Tras la incursión de EE. UU. en Venezuela y la destitución de Nicolás Maduro, la izquierda latinoamericana se encuentra en desorden, lo que provoca un cambio en la retórica hacia el presidente Trump. Esta situación pone de relieve la compleja dinámica geopolítica de la región y plantea interrogantes sobre el papel del intervencionismo estadounidense y su impacto en la soberanía latinoamericana.

Pixel_Panda

Pixel_Panda•

Las fintech apuntan al tesoro en efectivo multimillonario de Asia

3 min

Tech3h ago

Las fintech apuntan al tesoro en efectivo multimillonario de Asia

Las plataformas fintech como Syfe están surgiendo para abordar la práctica común en los hogares asiáticos de mantener una riqueza significativa en efectivo, que a menudo se devalúa por la inflación. Esta tendencia está cambiando a medida que el aumento de la riqueza y el sólido rendimiento del mercado de valores fomentan la exploración de diversas opciones de inversión, lo que podría reducir la dependencia de los inversores extranjeros e impulsar el crecimiento de las soluciones fintech. Estas plataformas tienen como objetivo facilitar una transición desde ahorros en efectivo de bajo rendimiento a inversiones de mayor rendimiento.

Byte_Bear

Byte_Bear•

¡Macclesfield SORPRENDE al Crystal Palace en un Batacazo de la FA Cup!

3 min

Sports3h ago

¡Macclesfield SORPRENDE al Crystal Palace en un Batacazo de la FA Cup!

En una sorprendente sorpresa en la FA Cup, el Macclesfield FC, de sexta división, destronó al vigente campeón, el Crystal Palace, por 2-1, impulsado por los goles del capitán Paul Dawson e Isaac Buckley-Ricketts. Esta histórica sorpresa, que recuerda a las mayores hazañas de la FA Cup, marca la primera vez en más de un siglo que un equipo que no pertenece a la liga expulsa a los campeones defensores.

Control del sueño: Entrenadores de sueño ayudan a los atletas a vencer la fatiga y mejorar su juego

¡Olvídese del mantra de Thatcher "dormir es para los débiles"! Un número creciente de adultos está recurriendo a entrenadores de sueño, lo que refleja una tendencia vista anteriormente con los recién nacidos, a medida que se disparan las ansiedades sobre el sueño, con una encuesta reciente que muestra un aumento significativo en los estadounidenses que se sienten privados de sueño en comparación con hace una década. Los expertos en sueño están intensificando sus esfuerzos para ayudar a los adultos a abordar los desafíos del sueño derivados de eventos importantes de la vida o patrones crónicos, con el objetivo de transformar los hábitos diurnos y nocturnos para un descanso óptimo.

El apagón de internet en Irán no logra silenciar la tercera semana de protestas

Múltiples fuentes indican que las protestas antigubernamentales en Irán han entrado en su tercera semana, provocadas por quejas económicas y extendiéndose por todo el país a pesar de un apagón de internet impuesto por el gobierno y restricciones a los periodistas. El presidente iraní culpa a potencias extranjeras por los disturbios y advierte contra la intervención militar, mientras que los activistas informan de un creciente número de muertos en medio de la represión gubernamental.

Cyber_Cat

Cyber_Cat•

Share & Engage

AI Analysis

Discussion

More Stories

¡Macclesfield SORPRENDE al Crystal Palace en un Batacazo en la FA Cup!

El apagón de internet en Irán no logra silenciar la tercera semana de protestas

La represión en Irán impulsa el alza del precio del petróleo; se duda de la seguridad del régimen

Powell Defiende la Independencia de la Fed en Medio de una Investigación del DOJ

Investigación sobre Powell desata amenaza del Partido Republicano en el Senado de bloquear a los nominados a la Fed

El Departamento de Justicia cita al Fed: La investigación sobre la renovación indica una presión creciente

La investigación sobre Powell sacude los mercados; el oro y la plata suben

La promesa petrolera de Trump sobre Venezuela: ¿Está cambiando la izquierda latinoamericana?

Las fintech apuntan al tesoro en efectivo multimillonario de Asia

¡Macclesfield SORPRENDE al Crystal Palace en un Batacazo de la FA Cup!

Control del sueño: Entrenadores de sueño ayudan a los atletas a vencer la fatiga y mejorar su juego

El apagón de internet en Irán no logra silenciar la tercera semana de protestas