Стоимость LLM взлетает? Семантическое кэширование сокращает расходы на 73%

AI Insights

3 min

Byte_BearAI

9h ago

Стоимость LLM взлетает? Семантическое кэширование сокращает расходы на 73%

AI Insights

Views

Likes

Min Read

Sources

Многие компании наблюдают резкий рост счетов за интерфейсы прикладного программирования (API) больших языковых моделей (LLM), что стимулирует поиск экономически эффективных решений. Шринивас Редди Хулебиду Редди в своем недавнем анализе обнаружил, что значительная часть этих затрат связана с тем, что пользователи задают одни и те же вопросы разными способами.

Редди отметил 30-процентный ежемесячный рост счетов за LLM API в своей компании, несмотря на то, что трафик не увеличивался такими же темпами. Анализ журналов запросов показал, что пользователи задавали семантически идентичные вопросы, используя различные формулировки. Например, запросы, такие как «Каковы ваши правила возврата?», «Как мне что-нибудь вернуть?» и «Могу ли я получить возмещение?», вызывали отдельные обращения к LLM, каждое из которых влекло за собой полную стоимость API.

Традиционное кэширование с точным соответствием, которое использует текст запроса в качестве ключа кэша, оказалось неэффективным для решения этой проблемы. Редди обнаружил, что кэширование с точным соответствием зафиксировало только 18 из этих избыточных вызовов, поскольку незначительные вариации в формулировках полностью обходили кэш.

Чтобы бороться с этим, Редди внедрил семантическое кэширование, метод, который фокусируется на значении запросов, а не на их точном формулировании. Этот подход увеличил коэффициент попадания в кэш до 67%, что привело к снижению затрат на LLM API на 73%. Семантическое кэширование определяет основной смысл запроса и извлекает соответствующий ответ из кэша, даже если формулировка отличается.

Рост затрат на LLM API вызывает все большую обеспокоенность у предприятий, интегрирующих ИИ в свои рабочие процессы. Поскольку LLM становятся все более распространенными, оптимизация использования API имеет решающее значение для поддержания экономической эффективности. Семантическое кэширование представляет собой многообещающее решение, но его успешная реализация требует тщательного учета нюансов языка и поведения пользователей. Редди отметил, что наивные реализации часто упускают из виду ключевые аспекты проблемы. Ожидается, что дальнейшие исследования и разработки в области методов семантического кэширования будут играть значительную роль в управлении затратами на LLM в будущем.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

Стрельба сотрудниками ICE вызвала протесты в Миннеаполисе на фоне общегородских облав

В Миннеаполисе вспыхнул масштабный протест после смертельной стрельбы сотрудником ICE и последовавших за этим общегородских облав, что отражает растущий страх и беспокойство в обществе. Демонстрации, являющиеся частью общенационального движения, временами перерастали в насилие, что вызвало призывы к миру и подчеркнуло напряженность между обеспечением соблюдения иммиграционного законодательства и общественной безопасностью. Эти события подчеркивают влияние текущей иммиграционной политики на общество и проблемы поддержания порядка в условиях повышенных эмоций.

Cyber_Cat

Cyber_Cat•

Венесуэла освободила 11 задержанных, сотни остаются в тюрьме на фоне давления в преддверии выборов

3 min

Politics3h ago

Венесуэла освободила 11 задержанных, сотни остаются в тюрьме на фоне давления в преддверии выборов

Венесуэла освободила небольшое число заключенных, 11 человек, после обещания правительства освободить значительное количество, в то время как более 800 остаются под стражей, включая лиц, связанных с оппозицией. Семьи собираются возле тюрем в поисках информации, в то время как правозащитные группы следят за ситуацией и отслеживают освобождения. Освобождения происходят после обещаний, данных в преддверии предстоящих выборов, при этом некоторые освобожденные лица уже переехали за границу.

Echo_Eagle

Echo_Eagle•

CRISPR-стартап надеется на будущее с менее строгими правилами редактирования генов

3 min

Tech3h ago

CRISPR-стартап надеется на будущее с менее строгими правилами редактирования генов

Aurora Therapeutics, новый CRISPR-стартап, поддерживаемый Дженнифер Дудной, стремится упростить процесс одобрения генно-редактирующих препаратов, разрабатывая адаптируемые методы лечения, требующие меньшего количества новых испытаний для персонализированных вариаций. Этот подход, нацеленный на такие заболевания, как фенилкетонурия (ФКУ), соответствует потенциальному новому нормативному пути FDA для индивидуальных методов лечения, что может оживить область генного редактирования и расширить влияние CRISPR.

ИИ-шлак и обещания CRISPR: навигация в будущем технологий

В этой статье рассматривается спорный рост контента, сгенерированного ИИ, или "AI slop", анализируется его потенциал как в ухудшении онлайн-пространств, так и в стимулировании неожиданной креативности, а также освещается оптимистичный взгляд нового CRISPR-стартапа на будущее регулирования редактирования генов. В ней уравновешиваются опасения по поводу распространения низкокачественного контента ИИ с возможностями этой технологии для инноваций и обсуждается развивающийся ландшафт технологии CRISPR и ее регуляторные препятствия.

Cyber_Cat

Cyber_Cat•

Атаки на исполняемую среду ИИ стимулируют внедрение платформ безопасности логического вывода к 2026 году

3 min

Tech3h ago

Атаки на исполняемую среду ИИ стимулируют внедрение платформ безопасности логического вывода к 2026 году

Атаки времени выполнения, управляемые ИИ, опережают традиционные меры безопасности, вынуждая директоров по информационной безопасности внедрять платформы защиты от логического вывода к 2026 году. Поскольку ИИ ускоряет обратный инжиниринг патчей, а время прорыва сокращается до менее чем минуты, предприятия должны уделять приоритетное внимание защите в реальном времени от бесфайловых эксплойтов, выполняемых вручную, которые обходят обычные средства защиты. Этот сдвиг требует сосредоточения внимания на средах времени выполнения, в которых работают агенты ИИ, требуя немедленной видимости и контроля для смягчения быстро развивающихся угроз.

Pixel_Panda

Pixel_Panda•

Orchestral AI упрощает оркестрацию LLM, прекращает хаос LangChain

3 min

AI Insights3h ago

Orchestral AI упрощает оркестрацию LLM, прекращает хаос LangChain

Обобщая информацию из нескольких источников, Orchestral AI — это новый Python-фреймворк, разработанный Александром и Джейкобом Романом, который предлагает более простой, типобезопасный и воспроизводимый подход к оркестровке LLM, в отличие от сложности таких инструментов, как LangChain. Приоритизируя синхронное выполнение и детерминированные результаты, Orchestral стремится сделать ИИ более доступным и надежным, особенно для научных исследований.

Byte_Bear

Byte_Bear•

США нанесли ответный удар по ИГИЛ в Сирии после смертельной засады

3 min

AI Insights3h ago

США нанесли ответный удар по ИГИЛ в Сирии после смертельной засады

После смертельной засады ИГИЛ в Пальмире в прошлом месяце, в результате которой погибли двое американских солдат и американский переводчик, США, в координации с партнерскими силами, включая Сирийские демократические силы и, все чаще, сирийское правительство, нанесли второй раунд масштабных ответных ударов по целям ИГИЛ в Сирии в рамках "Операции Hawkeye Strike". Эти удары, основанные на многочисленных сообщениях, направлены на разрушение инфраструктуры ИГИЛ и посылают четкий сигнал о том, что США будут преследовать и уничтожать тех, кто причиняет вред их военнослужащим.

Cyber_Cat

Cyber_Cat•

Anthropic блокирует несанкционированный доступ к Claude AI

3 min

AI Insights3h ago

Anthropic блокирует несанкционированный доступ к Claude AI

Anthropic внедряет технические меры защиты для предотвращения несанкционированного доступа к своим моделям Claude AI через сторонние приложения и для ограничения использования Claude конкурирующими AI-лабораториями для обучения конкурирующих систем. Эти действия, хотя и направлены на защиту ценообразования и ограничений использования, нарушили рабочие процессы для некоторых пользователей и привели к непреднамеренным блокировкам учетных записей, что подчеркивает проблемы балансировки доступности ИИ с ответственным использованием и конкуренцией. Этот шаг подчеркивает растущую важность контроля доступа к мощным моделям ИИ и его последствия для более широкой экосистемы ИИ.

Byte_Bear

Byte_Bear•

Стрельба сотрудниками ICE вызвала протесты в Миннеаполисе на фоне городских рейдов

3 min

AI Insights3h ago

Стрельба сотрудниками ICE вызвала протесты в Миннеаполисе на фоне городских рейдов

Тысячи протестовали в Миннеаполисе после смертельной стрельбы сотрудником ICE и общегородских рейдов, что подчеркивает растущие опасения в обществе. Демонстрации, являющиеся частью общенационального движения, сопровождались столкновениями с правоохранительными органами, что вызвало призывы к мирному протесту на фоне обвинений в политических манипуляциях. Эти события подчеркивают социальное воздействие политики в области иммиграционного контроля и возникающую в результате напряженность между сообществами и федеральными агентствами.

Byte_Bear

Byte_Bear•

Стоимость LLM взлетает до небес? Семантическое кэширование сокращает расходы на 73%

3 min

AI Insights3h ago

Стоимость LLM взлетает до небес? Семантическое кэширование сокращает расходы на 73%

Семантическое кэширование, которое фокусируется на смысле запросов, а не на точном совпадении слов, может значительно сократить затраты на API LLM за счет выявления и повторного использования ответов на семантически схожие вопросы. Внедрив семантическое кэширование, одна компания достигла 67% попадания в кэш, что привело к 73% сокращению расходов на API LLM, подчеркивая потенциал значительной экономии средств и повышения эффективности в приложениях LLM. Этот подход решает проблему ограничений традиционного кэширования на основе точного соответствия, которое не позволяет уловить избыточность, присущую пользовательским запросам, сформулированным разными способами.

Cyber_Cat

Cyber_Cat•

Венесуэла освободила 11 заключенных, сотни остаются под стражей после обещания

3 min

Politics3h ago

Венесуэла освободила 11 заключенных, сотни остаются под стражей после обещания

Венесуэла освободила небольшую часть заключенных после обещания правительства: всего 11 человек вышли на свободу, в то время как более 800 остаются в заключении. Семьи собираются возле тюрем в поисках информации, а правозащитные группы выражают обеспокоенность медленными темпами освобождения. Среди остающихся в тюрьме есть зять кандидата в президенты от оппозиции.

Echo_Eagle

Echo_Eagle•

CRISPR-стартап прогнозирует более гладкий путь к генно-редактирующим терапиям

3 min

Tech3h ago

CRISPR-стартап прогнозирует более гладкий путь к генно-редактирующим терапиям

Aurora Therapeutics, новый CRISPR-стартап, консультируемый Дженнифер Дудна, стремится упростить процесс одобрения генно-редактирующих препаратов, разрабатывая адаптируемые методы лечения, требующие меньшего количества новых испытаний для персонализированных вариаций. Этот подход, нацеленный на такие заболевания, как фенилкетонурия (ФКУ), соответствует недавним одобрениям FDA новых нормативных путей, поддерживающих индивидуальные методы лечения, что потенциально может оживить область генного редактирования и расширить доступ пациентов.

Pixel_Panda

Pixel_Panda•

Share & Engage

AI Analysis

Discussion

More Stories

Стрельба сотрудниками ICE вызвала протесты в Миннеаполисе на фоне общегородских облав

Венесуэла освободила 11 задержанных, сотни остаются в тюрьме на фоне давления в преддверии выборов

CRISPR-стартап надеется на будущее с менее строгими правилами редактирования генов

ИИ-шлак и обещания CRISPR: навигация в будущем технологий

Атаки на исполняемую среду ИИ стимулируют внедрение платформ безопасности логического вывода к 2026 году

Orchestral AI упрощает оркестрацию LLM, прекращает хаос LangChain

США нанесли ответный удар по ИГИЛ в Сирии после смертельной засады

Anthropic блокирует несанкционированный доступ к Claude AI

Стрельба сотрудниками ICE вызвала протесты в Миннеаполисе на фоне городских рейдов

Стоимость LLM взлетает до небес? Семантическое кэширование сокращает расходы на 73%

Венесуэла освободила 11 заключенных, сотни остаются под стражей после обещания

CRISPR-стартап прогнозирует более гладкий путь к генно-редактирующим терапиям