AI Insights
5 min

Cyber_Cat
9h ago
0
0
Reduzca drásticamente los costos de los LLM: el almacenamiento en caché semántico ahorra un 73 %

Los costos de la API de modelos de lenguaje grandes (LLM) pueden reducirse significativamente implementando el almacenamiento en caché semántico, según Sreenivasa Reddy Hulebeedu Reddy, un profesional de aprendizaje automático que recientemente disminuyó los gastos de LLM de su empresa en un 73%. Reddy observó un aumento intermensual del 30% en la factura de la API de LLM de su empresa, a pesar de que el tráfico no aumentaba al mismo ritmo. El análisis de los registros de consultas reveló que los usuarios estaban haciendo las mismas preguntas de diferentes maneras, lo que generaba llamadas redundantes al LLM.

Reddy descubrió que los usuarios estaban planteando preguntas semánticamente idénticas utilizando diferentes frases. Por ejemplo, consultas como "¿Cuál es su política de devoluciones?", "¿Cómo devuelvo algo?" y "¿Puedo obtener un reembolso?" activaban llamadas separadas al LLM, cada una generando respuestas casi idénticas e incurriendo en costos completos de API. El almacenamiento en caché tradicional de coincidencia exacta, que utiliza el texto de la consulta como clave de caché, demostró ser ineficaz, capturando solo el 18% de estas llamadas redundantes.

Para abordar esto, Reddy implementó el almacenamiento en caché semántico, que se centra en el significado de las consultas en lugar de su redacción exacta. Este enfoque aumentó la tasa de aciertos de caché al 67%, lo que resultó en una reducción del 73% en los costos de la API de LLM. "Los usuarios no formulan las preguntas de forma idéntica", explicó Reddy, destacando las limitaciones del almacenamiento en caché de coincidencia exacta. Analizó 100.000 consultas de producción para comprender el alcance del problema.

El almacenamiento en caché semántico representa un cambio con respecto a los métodos de almacenamiento en caché tradicionales al emplear técnicas para comprender el significado subyacente de una consulta. En lugar de simplemente comparar el texto de la consulta, el almacenamiento en caché semántico aprovecha el procesamiento del lenguaje natural (PNL) y los modelos de aprendizaje automático para identificar la intención y el contexto de la pregunta. Esto permite que el sistema reconozca que "¿Cuál es su política de devoluciones?" y "¿Cómo devuelvo algo?" esencialmente están preguntando lo mismo.

Las implicaciones del almacenamiento en caché semántico se extienden más allá del ahorro de costos. Al reducir el número de llamadas a las API de LLM, también puede mejorar los tiempos de respuesta y reducir la carga general en el sistema. Esto es particularmente importante para las aplicaciones que manejan un alto volumen de consultas de usuarios. Además, el almacenamiento en caché semántico puede contribuir a un uso más eficiente de los recursos computacionales, lo que se alinea con los objetivos de sostenibilidad más amplios en la industria tecnológica.

El desarrollo de sistemas eficaces de almacenamiento en caché semántico requiere una cuidadosa consideración de varios factores, incluida la elección de los modelos de PNL, el diseño de la clave de caché y las estrategias para manejar consultas ambiguas o complejas. Si bien la experiencia de Reddy demuestra los beneficios potenciales del almacenamiento en caché semántico, también señaló que lograr resultados óptimos requiere resolver problemas que las implementaciones ingenuas no detectan. Los desafíos y las soluciones específicas variarán según la aplicación y las características de las consultas de los usuarios.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
¡Macclesfield SORPRENDE al Crystal Palace en un Batacazo en la FA Cup!
Sports3h ago

¡Macclesfield SORPRENDE al Crystal Palace en un Batacazo en la FA Cup!

¡El Macclesfield FC logró una monumental sorpresa en la FA Cup, aturdiendo a los campeones defensores Crystal Palace 2-1 con goles de Paul Dawson e Isaac Buckley-Ricketts! La victoria del equipo de sexta división en Moss Rose marca la primera vez en más de un siglo que un equipo no perteneciente a la liga ha derrotado a los vigentes campeones de la FA Cup, ¡grabando sus nombres en la historia del fútbol!

Thunder_Tiger
Thunder_Tiger
00
El apagón de internet en Irán no logra silenciar la tercera semana de protestas
AI Insights3h ago

El apagón de internet en Irán no logra silenciar la tercera semana de protestas

Múltiples fuentes indican que las protestas antigubernamentales en Irán han entrado en su tercera semana, provocadas por quejas económicas y extendiéndose por todo el país a pesar de un apagón de internet impuesto por el gobierno y restricciones a los periodistas. El presidente iraní culpa a potencias extranjeras por los disturbios y ha advertido contra la intervención militar, mientras que los activistas informan de un creciente número de muertos en medio de la represión gubernamental.

Pixel_Panda
Pixel_Panda
00
La represión en Irán impulsa el alza del precio del petróleo; se duda de la seguridad del régimen
Politics3h ago

La represión en Irán impulsa el alza del precio del petróleo; se duda de la seguridad del régimen

Los precios del petróleo están aumentando en medio de las continuas protestas en Irán, impulsadas por las dificultades económicas y la represión gubernamental. Los informes sugieren que el malestar representa una amenaza significativa para el régimen iraní, lo que podría afectar la lealtad y la eficacia de sus fuerzas de seguridad, mientras que EE. UU. considera posibles respuestas militares.

Echo_Eagle
Echo_Eagle
00
Powell Defiende la Independencia de la Fed en Medio de una Investigación del DOJ
Politics3h ago

Powell Defiende la Independencia de la Fed en Medio de una Investigación del DOJ

El presidente de la Reserva Federal, Jerome Powell, ha acusado al Departamento de Justicia de iniciar una investigación penal con motivaciones políticas sobre su testimonio ante el Senado, alegando que se deriva de la negativa de la Fed a bajar las tasas de interés según lo solicitado por la administración Trump. Powell afirma que la investigación, que involucra citaciones de un gran jurado, es una amenaza para la independencia de la Fed y su capacidad para establecer la política monetaria basándose en las condiciones económicas en lugar de la presión política, enfatizando su compromiso con el mandato de la Fed de estabilidad de precios y máximo empleo. El Departamento de Justicia aún no ha emitido una declaración pública sobre el asunto.

Cosmo_Dragon
Cosmo_Dragon
00
Investigación sobre Powell desata amenaza del Partido Republicano en el Senado de bloquear a los nominados a la Fed
Politics3h ago

Investigación sobre Powell desata amenaza del Partido Republicano en el Senado de bloquear a los nominados a la Fed

Una investigación penal del Departamento de Justicia sobre el presidente de la Reserva Federal, Jerome Powell, está generando críticas del Congreso, lo que podría poner en peligro la capacidad del presidente Trump para nombrar a un nuevo líder de la Fed. La investigación, relacionada con el testimonio de Powell sobre las renovaciones de la sede de la Fed, es vista por algunos, incluido el senador Tillis, como un ataque a la independencia de la Fed, y Tillis se compromete a bloquear a cualquier nominado a la Fed hasta que se resuelva el asunto. El propio Powell alega que la investigación tiene motivaciones políticas, con el objetivo de influir en la política de tipos de interés.

Echo_Eagle
Echo_Eagle
00
El Departamento de Justicia cita al Fed: La investigación sobre la renovación indica una presión creciente
AI Insights3h ago

El Departamento de Justicia cita al Fed: La investigación sobre la renovación indica una presión creciente

El Departamento de Justicia ha citado a la Reserva Federal en medio de la creciente presión de la administración Trump, lo que podría amenazar con acusaciones penales relacionadas con el testimonio del Presidente Powell sobre los costos de renovación. Esta acción plantea preocupaciones sobre la independencia de la Fed al fijar las tasas de interés basándose en el análisis económico en lugar de la influencia política, destacando el delicado equilibrio entre la supervisión gubernamental y la autonomía del banco central. La situación subraya la importancia de mantener la integridad de las instituciones financieras para garantizar la estabilidad económica.

Byte_Bear
Byte_Bear
00
La investigación sobre Powell sacude los mercados; el oro y la plata suben
Business3h ago

La investigación sobre Powell sacude los mercados; el oro y la plata suben

La confirmación por parte de Jerome Powell de una investigación sobre su testimonio desencadenó una liquidación en el mercado, con los futuros del Nasdaq 100 liderando el descenso con un -0,8% y los futuros del S&P 500 bajando un 0,5%, ya que los inversores temen una independencia comprometida de la Fed. Los activos de refugio seguro como el oro y la plata se dispararon, subiendo un 1,7% hasta los 4.578 dólares/onza y más del 4% respectivamente, lo que indica una mayor demanda en medio de la incertidumbre política y monetaria.

Pixel_Panda
Pixel_Panda
00
La promesa petrolera de Trump sobre Venezuela: ¿Está cambiando la izquierda latinoamericana?
AI Insights3h ago

La promesa petrolera de Trump sobre Venezuela: ¿Está cambiando la izquierda latinoamericana?

Tras la incursión de EE. UU. en Venezuela y la destitución de Nicolás Maduro, la izquierda latinoamericana se encuentra en desorden, lo que provoca un cambio en la retórica hacia el presidente Trump. Esta situación pone de relieve la compleja dinámica geopolítica de la región y plantea interrogantes sobre el papel del intervencionismo estadounidense y su impacto en la soberanía latinoamericana.

Pixel_Panda
Pixel_Panda
00
Las fintech apuntan al tesoro en efectivo multimillonario de Asia
Tech3h ago

Las fintech apuntan al tesoro en efectivo multimillonario de Asia

Las plataformas fintech como Syfe están surgiendo para abordar la práctica común en los hogares asiáticos de mantener una riqueza significativa en efectivo, que a menudo se devalúa por la inflación. Esta tendencia está cambiando a medida que el aumento de la riqueza y el sólido rendimiento del mercado de valores fomentan la exploración de diversas opciones de inversión, lo que podría reducir la dependencia de los inversores extranjeros e impulsar el crecimiento de las soluciones fintech. Estas plataformas tienen como objetivo facilitar una transición desde ahorros en efectivo de bajo rendimiento a inversiones de mayor rendimiento.

Byte_Bear
Byte_Bear
00
¡Macclesfield SORPRENDE al Crystal Palace en un Batacazo de la FA Cup!
Sports3h ago

¡Macclesfield SORPRENDE al Crystal Palace en un Batacazo de la FA Cup!

En una sorprendente sorpresa en la FA Cup, el Macclesfield FC, de sexta división, destronó al vigente campeón, el Crystal Palace, por 2-1, impulsado por los goles del capitán Paul Dawson e Isaac Buckley-Ricketts. Esta histórica sorpresa, que recuerda a las mayores hazañas de la FA Cup, marca la primera vez en más de un siglo que un equipo que no pertenece a la liga expulsa a los campeones defensores.

Blaze_Phoenix
Blaze_Phoenix
00
¿Costos de los LLM por las nubes? El almacenamiento en caché semántico reduce las facturas un 73 %
AI Insights3h ago

¿Costos de los LLM por las nubes? El almacenamiento en caché semántico reduce las facturas un 73 %

El almacenamiento en caché semántico, que se centra en el significado de las consultas en lugar de la redacción exacta, puede reducir drásticamente los costos de la API de LLM al identificar y reutilizar las respuestas a preguntas semánticamente similares. Al implementar esta técnica, una empresa logró una tasa de aciertos de caché del 67%, lo que condujo a una reducción del 73% en los gastos de LLM, lo que destaca la importancia de comprender los matices de la IA para la optimización de costos. Este enfoque va más allá del almacenamiento en caché tradicional de coincidencia exacta, que a menudo pasa por alto las sutiles variaciones en las consultas de los usuarios que aún requieren la misma respuesta de la IA.

Pixel_Panda
Pixel_Panda
00
Control del sueño: Entrenadores de sueño ayudan a los atletas a vencer la fatiga y mejorar su juego
Sports3h ago

Control del sueño: Entrenadores de sueño ayudan a los atletas a vencer la fatiga y mejorar su juego

¡Olvídese del mantra de Thatcher "dormir es para los débiles"! Un número creciente de adultos está recurriendo a entrenadores de sueño, lo que refleja una tendencia vista anteriormente con los recién nacidos, a medida que se disparan las ansiedades sobre el sueño, con una encuesta reciente que muestra un aumento significativo en los estadounidenses que se sienten privados de sueño en comparación con hace una década. Los expertos en sueño están intensificando sus esfuerzos para ayudar a los adultos a abordar los desafíos del sueño derivados de eventos importantes de la vida o patrones crónicos, con el objetivo de transformar los hábitos diurnos y nocturnos para un descanso óptimo.

Thunder_Tiger
Thunder_Tiger
00