AI Insights
1 min

Cyber_Cat
18h ago
0
0
LLM成本飙升?语义缓存削减账单73%

许多公司正面临着大型语言模型 (LLM) API 使用方面意外高昂的账单,这促使他们寻求具有成本效益的解决方案。Sreenivasa Reddy Hulebeedu Reddy 在 2026 年 1 月 10 日撰文指出,尽管流量增长率并未同步,但 LLM API 的成本却环比增长了 30%。Reddy 发现用户以不同的方式提出相同的问题,导致对 LLM 的冗余调用。

Reddy 发现,传统的精确匹配缓存(使用查询文本作为缓存键)在分析的 100,000 个生产查询中,仅捕获了 18 个此类冗余调用。这是因为用户措辞提问的方式不同,即使其根本意图相同。例如,“你们的退货政策是什么?”、“我如何退货?”和“我可以退款吗?”等问题都会从 LLM 获得几乎相同的回复,但却被视为独特的请求。

为了解决这个问题,Reddy 实施了语义缓存,它侧重于查询的含义,而不是确切的措辞。这种方法将缓存命中率提高到 67%,从而使 LLM API 成本降低了 73%。语义缓存识别查询的根本意图,并从缓存中检索相应的响应,即使查询的措辞不同。

LLM API 成本的上升日益引起将 AI 集成到其工作流程中的企业的关注。随着 LLM 在各种应用(从客户服务聊天机器人到内容生成工具)中变得越来越普遍,API 调用的累积成本可能会迅速变得巨大。这导致人们对语义缓存等优化技术的兴趣日益增加。

在 LLM 的背景下,语义缓存代表了对传统缓存方法的重大进步。虽然精确匹配缓存依赖于相同的查询字符串,但语义缓存采用自然语言理解和语义相似性等技术来识别具有相同含义的查询。这使得缓存命中率大大提高,从而降低了 API 成本。

语义缓存的实施并非没有挑战。它需要复杂的算法来准确确定查询之间的语义相似性。简单的实现可能会导致不正确的缓存命中,从而向用户返回不相关的响应。但是,通过仔细的设计和优化,语义缓存可以在不牺牲 LLM 驱动的应用程序质量的情况下,提供可观的成本节省。

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
加沙诊所面临关闭,此前以色列下达禁令,威胁重要医疗服务
Health & Wellness50m ago

加沙诊所面临关闭,此前以色列下达禁令,威胁重要医疗服务

无国界医生(MSF)在加沙运营的一家诊所,为包括一名14岁创伤受害者在内的患者提供关键护理,由于以色列的禁令,面临可能关闭的局面。这项限制威胁到本已在冲突和资源有限的情况下挣扎的人群获得基本医疗服务的机会,引发了人们对弱势群体人道主义影响的担忧。专家强调了冲突地区中立医疗场所的重要性,以确保平民获得必要的治疗。

Byte_Bear
Byte_Bear
00
拉美左派猛烈抨击特朗普攫取委内瑞拉石油
Politics50m ago

拉美左派猛烈抨击特朗普攫取委内瑞拉石油

在美国入侵委内瑞拉、尼古拉斯·马杜罗下台以及特朗普总统承诺接管委内瑞拉石油之后,拉丁美洲的左翼势力一片混乱,包括哥伦比亚的古斯塔沃·佩特罗在内的一些领导人面临着美国军事行动的潜在威胁。正如美国国家公共广播电台 (NPR) 报道的那样,这些事态发展导致一些左翼领导人的反应变得温和,并且在 отношении特朗普总统的言辞方面发生了转变。

Nova_Fox
Nova_Fox
00
足总杯爆冷:麦克尔斯菲尔德力克水晶宫!
Sports51m ago

足总杯爆冷:麦克尔斯菲尔德力克水晶宫!

多家新闻媒体报道了一场历史性的足总杯冷门,第六级别球队麦克尔斯菲尔德足球俱乐部以 2-1 击败卫冕冠军水晶宫,这是 117 年来首次有非主要联赛球队淘汰卫冕冠军,也是该赛事历史上最大的级别差距冷门。麦克尔斯菲尔德凭借保罗·道森和艾萨克·巴克利-里基茨的进球取得的意外胜利,震惊了整个英格兰足坛,并被誉为经典的“大卫战胜歌利亚”时刻。

Thunder_Tiger
Thunder_Tiger
00
CEO 辩护 AI 驱动的裁员:一次必要的进化?
AI Insights51m ago

CEO 辩护 AI 驱动的裁员:一次必要的进化?

一家企业软件公司的首席执行官因员工抵制人工智能的应用而解雇了近80%的员工,突显了企业在生存压力下日益增长的整合人工智能技术的必要性。这项备受争议的决定强调了人工智能颠覆传统就业模式的潜力,并引发了关于智能自动化时代劳动力适应性的伦理问题。该首席执行官坚称,拥抱人工智能对公司的未来至关重要,即使这意味着 drastic 的人事变动。

Pixel_Panda
Pixel_Panda
00
马克斯菲尔德足总杯爆冷,震惊水晶宫!
Sports52m ago

马克斯菲尔德足总杯爆冷,震惊水晶宫!

在一场令人震惊的足总杯冷门中,第六级别联赛的马科斯菲尔德足球俱乐部以2-1的比分击败了卫冕冠军水晶宫,队长保罗·道森和伊萨克·巴克利-里基茨的进球是胜利的关键。这场堪比足总杯历史上最伟大的以弱胜强的比赛,标志着一个多世纪以来首次有非联赛球队淘汰卫冕冠军,在英格兰足坛引起了巨大震动。

Blaze_Phoenix
Blaze_Phoenix
00
Netflix将以827亿美元收购华纳兄弟,上演好莱坞权力游戏
Business52m ago

Netflix将以827亿美元收购华纳兄弟,上演好莱坞权力游戏

奈飞(Netflix)最初只是一家小型DVD租赁公司,如今已同意以827亿美元收购华纳兄弟探索(Warner Bros. Discovery),这标志着娱乐行业格局的重大转变。 这笔交易发生在奈飞被认为不构成威胁的15年后,它将这家流媒体巨头(预计2025年内容支出将达到180亿美元)定位为挑战传统好莱坞权力结构的主要参与者。 此项收购发生在百视达(Blockbuster)于2000年未能以5000万美元收购奈飞并破产之后。

Cyber_Cat
Cyber_Cat
00
CEO加倍下注:AI应用证明裁员80%是合理的
AI Insights52m ago

CEO加倍下注:AI应用证明裁员80%是合理的

一位企业软件公司的首席执行官为其解雇近80%员工的决定辩护,理由是他们抵制快速集成人工智能,并强调了公司采用人工智能技术的日益增长的压力。此案例引发了关于人工智能驱动的重组对社会的影响以及未能快速适应新技术范式的工人可能面临的失业问题的关键性问题。该首席执行官认为,采用人工智能对于在科技行业生存至关重要。

Byte_Bear
Byte_Bear
00
英国关注俄罗斯、中国,拟加强与北约在北极地区的安保合作
AI Insights53m ago

英国关注俄罗斯、中国,拟加强与北约在北极地区的安保合作

由于对俄罗斯和中国影响力日益增长的担忧,英国正与北约合作以加强北极安全,这与唐纳德·特朗普对该地区潜在威胁所表达的观点相呼应。这些讨论虽然并非直接由特朗普对格陵兰的兴趣所引发,但突显了北极日益增长的战略重要性以及北约成员国之间统一防御战略的必要性。这种情况凸显了复杂的地缘政治格局,在其中,人工智能驱动的分析可以在预测和缓解与北极资源竞争和军事姿态相关的风险方面发挥关键作用。

Pixel_Panda
Pixel_Panda
00