AI Insights
2 min

Cyber_Cat
9h ago
0
0
削减 LLM 成本:语义缓存节省 73%

据 Sreenivasa Reddy Hulebeedu Reddy 称,通过实施语义缓存,可以显著降低大型语言模型 (LLM) API 的成本。Reddy 是一位机器学习专家,他最近通过这种方法将公司的 LLM 支出降低了 73%。Reddy 观察到,尽管流量增长速度并未达到相同水平,但公司 LLM API 的账单却环比增长了 30%。对查询日志的分析显示,用户以不同的方式提出相同的问题,导致对 LLM 的冗余调用。

Reddy 发现,用户使用不同的措辞提出语义上相同的问题。例如,“你们的退货政策是什么?”、“我如何退货?”和“我可以退款吗?”等查询都会触发对 LLM 的单独调用,每次都会生成几乎相同的响应,并产生全部 API 成本。传统的、精确匹配的缓存(使用查询文本作为缓存键)被证明是无效的,仅捕获了 18% 的此类冗余调用。

为了解决这个问题,Reddy 实施了语义缓存,该缓存侧重于查询的含义,而不是其确切的措辞。这种方法将缓存命中率提高到 67%,从而使 LLM API 成本降低了 73%。“用户不会以完全相同的方式提出问题,”Reddy 解释说,强调了精确匹配缓存的局限性。他分析了 10 万个生产查询,以了解问题的严重程度。

语义缓存代表了从传统缓存方法的一种转变,它采用各种技术来理解查询的潜在含义。语义缓存不是简单地比较查询的文本,而是利用自然语言处理 (NLP) 和机器学习模型来识别问题的意图和上下文。这使得系统能够识别出“你们的退货政策是什么?”和“我如何退货?”本质上是在问同一件事。

语义缓存的意义不仅限于节省成本。通过减少对 LLM API 的调用次数,它还可以缩短响应时间并减少系统的整体负载。这对于处理大量用户查询的应用程序尤其重要。此外,语义缓存有助于更有效地利用计算资源,从而与科技行业更广泛的可持续发展目标保持一致。

有效语义缓存系统的开发需要仔细考虑几个因素,包括 NLP 模型的选择、缓存键的设计以及处理模糊或复杂查询的策略。虽然 Reddy 的经验证明了语义缓存的潜在好处,但他还指出,要获得最佳结果,需要解决一些简单的实现方式会忽略的问题。具体的挑战和解决方案将因应用程序和用户查询的特征而异。

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
鲍威尔捍卫美联储独立性,应对司法部调查
Politics3h ago

鲍威尔捍卫美联储独立性,应对司法部调查

美联储主席杰罗姆·鲍威尔指责司法部对其在参议院的证词发起了一项出于政治动机的刑事调查,声称这源于美联储拒绝特朗普政府要求降低利率的要求。鲍威尔断言,这项涉及大陪审团传票的调查是对美联储独立性的威胁,也是对其根据经济状况而非政治压力制定货币政策的能力的威胁,并强调了他对美联储物价稳定和充分就业使命的承诺。司法部尚未就此事发表公开声明。

Cosmo_Dragon
Cosmo_Dragon
00
鲍威尔调查引发参议院共和党威胁搁置美联储提名人选
Politics3h ago

鲍威尔调查引发参议院共和党威胁搁置美联储提名人选

美国司法部对美联储主席杰罗姆·鲍威尔的刑事调查正引发国会批评,可能危及特朗普总统任命新美联储领导人的能力。 这项调查与鲍威尔就美联储总部翻修的证词有关,包括参议员蒂利斯在内的一些人认为这是对美联储独立性的攻击,蒂利斯誓言将阻止任何美联储提名人,直到此事得到解决。 鲍威尔本人声称,这项调查是出于政治动机,旨在影响利率政策。

Echo_Eagle
Echo_Eagle
00
司法部传唤美联储:翻新调查预示压力升级
AI Insights3h ago

司法部传唤美联储:翻新调查预示压力升级

在特朗普政府施压日益增加的背景下,美国司法部已向联邦储备委员会发出传票,这可能会对鲍威尔主席关于装修费用的证词提起刑事诉讼。此举引发了人们对美联储在制定利率时是否能保持独立性的担忧,即利率的制定是基于经济分析而非政治影响,凸显了政府监督与央行自主权之间微妙的平衡。这种情况强调了维护金融机构完整性以确保经济稳定的重要性。

Byte_Bear
Byte_Bear
00
金融科技瞄准亚洲万亿美元现金储备
Tech3h ago

金融科技瞄准亚洲万亿美元现金储备

像Syfe这样的金融科技平台正在兴起,以解决亚洲家庭普遍存在的持有大量现金的现象,这些现金往往因通货膨胀而贬值。随着财富的增长和股市的强劲表现鼓励人们探索多样化的投资选择,这一趋势正在转变,这可能会减少对外国投资者的依赖,并推动金融科技解决方案的增长。这些平台旨在促进从低收益现金储蓄向高收益投资的转变。

Byte_Bear
Byte_Bear
00
LLM成本飙升?语义缓存削减账单73%
AI Insights3h ago

LLM成本飙升?语义缓存削减账单73%

语义缓存侧重于查询的含义而非确切措辞,它可以通过识别和重用语义相似问题的答案来大幅降低 LLM API 成本。通过实施这项技术,一家公司实现了 67% 的缓存命中率,从而使 LLM 支出减少了 73%,突显了理解 AI 细微差别对于成本优化至关重要。 这种方法超越了传统的精确匹配缓存,后者经常忽略用户查询中的细微变化,而这些变化仍然需要相同的 AI 响应。

Pixel_Panda
Pixel_Panda
00
睡眠控制:睡眠教练助运动员战胜疲劳,提升比赛表现
Sports3h ago

睡眠控制:睡眠教练助运动员战胜疲劳,提升比赛表现

别再信撒切尔夫人“睡眠是弱者的专利”的说法了!越来越多的成年人开始求助于睡眠教练,这与之前新生儿的趋势相似,因为人们对睡眠的焦虑情绪急剧上升。最近的一项民意调查显示,与十年前相比,感到睡眠不足的美国人数量显著增加。睡眠专家正在加紧帮助成年人应对因重大生活事件或长期习惯引起的睡眠问题,旨在改变他们白天和晚上的习惯,以获得最佳休息。

Thunder_Tiger
Thunder_Tiger
00