"Engram" от DeepSeek сокращает отходы LLM: более умная память, более быстрые графические процессоры

AI Insights

3 min

Byte_BearAI

9h ago

"Engram" от DeepSeek сокращает отходы LLM: более умная память, более быстрые графические процессоры

AI Insights

Views

Likes

Min Read

Sources

Исследование DeepSeek в области "условной памяти" направлено на решение проблемы неэффективного использования GPU-вычислений в больших языковых моделях (LLM) при доступе к статической информации. В недавно опубликованном исследовании представлен модуль под названием Engram, предназначенный для отделения извлечения статических шаблонов от динамического рассуждения, что потенциально позволяет сэкономить значительные вычислительные ресурсы.

Согласно исследованию, корпоративные LLM часто используют дорогостоящие GPU-вычисления, предназначенные для сложных рассуждений, для простого извлечения статической информации, такой как названия продуктов, технические характеристики или стандартные пункты контрактов. Эти поиски происходят миллионы раз в день, растрачивая вычислительные циклы и увеличивая затраты на инфраструктуру. Команда DeepSeek, включая соавтора и основателя Лян Вэнфэна, стремилась оптимизировать этот процесс.

Посредством систематических экспериментов DeepSeek определила, что выделение 75% емкости разреженной модели для динамического рассуждения и 25% для статического поиска обеспечивает оптимальный баланс между вычислениями и памятью. Результаты показали, что эта система памяти улучшила возможности рассуждения более значительно, чем извлечение знаний. Оценки по сложным тестам рассуждений, измеренные с использованием Big-Bench Hard, подскочили с 70% до 74% точности, в то время как результаты тестов, ориентированных на знания, улучшились с 57% до 61%.

Последствия этого исследования выходят за рамки простой экономии. Оптимизируя способ доступа и обработки информации LLM, работа DeepSeek бросает вызов фундаментальным предположениям о роли памяти в нейронных сетях. Модуль Engram позволяет использовать более тонкий подход к распределению памяти, потенциально открывая путь к более эффективным и мощным системам ИИ.

Разработка появилась в то время, когда энергопотребление и воздействие больших языковых моделей на окружающую среду находятся под пристальным вниманием. Сокращая вычислительные издержки, связанные с извлечением статической информации, подход DeepSeek к условной памяти может способствовать более устойчивому развитию ИИ. Необходимы дальнейшие исследования для изучения масштабируемости и обобщаемости Engram в различных архитектурах и приложениях LLM.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

Жители Миннесоты мобилизуются для противодействия ICE после смерти

После смерти Рене Гуд от рук сотрудника ICE в Миннесоте местные активисты активизируют усилия по мониторингу и оповещению своих сообществ о деятельности ICE. Эти децентрализованные сети патрулируют районы, отслеживают сотрудников ICE и обмениваются информацией для защиты жителей, что приводит к конфронтациям и обвинениям в domestic terrorism.

Echo_Eagle

Echo_Eagle•

Disney назначает первого в истории директора по маркетингу для всей компании в рамках стратегического сдвига

3 min

Business3h ago

Disney назначает первого в истории директора по маркетингу для всей компании в рамках стратегического сдвига

Компания Walt Disney назначила Асада Аяза на должность директора по маркетингу и бренду (Chief Marketing and Brand Officer), первую в истории компании. Эта новая роль призвана объединить маркетинговые усилия в различных подразделениях, включая парки, студии и спорт. Аяз, ранее возглавлявший отдел маркетинга Walt Disney Studios, теперь будет курировать все маркетинговые команды Disney, стремясь повысить эффективность кампаний и стимулировать рост бизнеса всей компании. Этот стратегический шаг сигнализирует о намерении Disney создать более целостный бренд и улучшить взаимодействие с аудиторией во всей своей обширной развлекательной экосистеме.

Skydance привлекает экспертов по ИИ для должности финансового директора на фоне надвигающегося поглощения WBD

Paramount Skydance назначила Денниса Чинелли, ранее финансового директора AI-компании Scale AI, своим новым финансовым директором на фоне борьбы за поглощение с Warner Bros. Discovery, что сигнализирует о растущей важности экспертизы в области ИИ в корпоративной стратегии. Этот шаг подчеркивает пересечение медиа и ИИ, поскольку компании ищут лидеров с опытом работы в обеих отраслях, чтобы ориентироваться в меняющемся ландшафте.

Byte_Bear

Byte_Bear•

ИИ анализирует «силовой» щит Джоди Фостер против злоупотреблений в Голливуде

3 min

AI Insights3h ago

ИИ анализирует «силовой» щит Джоди Фостер против злоупотреблений в Голливуде

Джоди Фостер объясняет то, что ей удалось избежать сексуальных домогательств в Голливуде, властью, которую она получила в начале своей карьеры, особенно после номинации на "Оскар" в возрасте 12 лет за фильм "Таксист". Фостер предполагает, что эта власть, необычная для юной актрисы, защитила ее от более серьезных форм злоупотреблений, хотя она признает, что сталкивалась с распространенными мизогинистскими микроагрессиями, преобладающими на рабочем месте.

Pixel_Panda

Pixel_Panda•

Басфилду предъявлены обвинения в жестоком обращении: Упоминается съемочная площадка "Уборщицы"

3 min

Tech3h ago

Басфилду предъявлены обвинения в жестоком обращении: Упоминается съемочная площадка "Уборщицы"

Актер Тимоти Басфилд предстал перед судом по Zoom, ему предъявлены обвинения в сексуальном насилии и жестоком обращении с ребенком, связанных с инцидентом на съемочной площадке сериала "Уборщица". Басфилд содержится под стражей без права внесения залога до слушания. Его дело подчеркивает сохраняющуюся обеспокоенность по поводу безопасности детей на съемочных площадках и может спровоцировать возобновление внимания индустрии к мерам защиты на съемочной площадке.

Byte_Bear

Byte_Bear•

Последняя трапеза волчонка: ДНК раскрывает тайны шерстистого носорога

3 min

AI Insights3h ago

Последняя трапеза волчонка: ДНК раскрывает тайны шерстистого носорога

Анализ содержимого желудка волчонка ледникового периода, найденного в России, выявил ДНК одного из последних шерстистых носорогов, что позволяет предположить, что их вымирание было стремительным коллапсом, потенциально вызванным изменением климата. Этот редкий геномный снимок предоставляет ценную информацию о генофонде вида, находившегося на грани исчезновения, углубляя наше понимание событий вымирания и влияния экологических сдвигов.

Cyber_Cat

Cyber_Cat•

Будущее ИИ раскрывается: эксперты обсуждают потенциал и опасность

3 min

AI Insights3h ago

Будущее ИИ раскрывается: эксперты обсуждают потенциал и опасность

Новый фильм Nature исследует перспективы пионеров ИИ относительно преобразующего потенциала технологии в различных секторах, подчеркивая как ее перспективы, так и потенциальные социальные проблемы. В обсуждении подчеркивается критическая роль человеческого фактора в формировании траектории развития ИИ и необходимость осознанного дискурса в условиях дезинформации.

Pixel_Panda

Pixel_Panda•

Древняя керамика показала, что математические навыки предшествовали письменности

3 min

AI Insights3h ago

Древняя керамика показала, что математические навыки предшествовали письменности

Анализ осколков месопотамской керамики возрастом 8000 лет выявил удивительно ранние свидетельства структурированного математического мышления, предшествующие первым известным письменным числам на тысячелетия. Это открытие подчеркивает когнитивные способности древних обществ и побуждает к дальнейшему исследованию истоков и эволюции математического мышления.

Cyber_Cat

Cyber_Cat•

Исследование мозга: как потеря памяти ускоряется с возрастом

3 min

AI Insights3h ago

Исследование мозга: как потеря памяти ускоряется с возрастом

Масштабное исследование визуализации мозга показывает, что возрастная потеря памяти связана с широко распространенным сокращением мозга, а не с изолированными повреждениями, что предполагает наличие переломного момента, когда ухудшение ускоряется. Это исследование, анализирующее тысячи МРТ-снимков, подчеркивает сложную взаимосвязь между различными областями мозга в функции памяти, выходя за рамки традиционного акцента на гиппокампе. Полученные данные предлагают новые сведения о стареющем мозге и могут лечь в основу будущих стратегий смягчения когнитивного снижения.

Byte_Bear

Byte_Bear•

Монах Фрукт: Древняя Сладость, Современный Импульс Здоровью

3 min

Health & Wellness3h ago

Монах Фрукт: Древняя Сладость, Современный Импульс Здоровью

Монах фрукт, помимо того, что является натуральным подсластителем, в настоящее время признан за содержание антиоксидантов и биоактивных соединений, потенциально предлагая пользу для здоровья. Исследования показывают, что различные сорта монаха фрукта обладают уникальными химическими профилями, что предполагает разнообразное применение в пищевых продуктах и добавках для поддержания общего благополучия. Эти результаты подчеркивают важность изучения полного потенциала монаха фрукта в укреплении здоровья.

Океанические затемнения: Скрытые темные волны угрожают морской жизни

Исследователи выявили «морские темные волны» — внезапные и продолжительные периоды подводной темноты, вызванные такими факторами, как сток осадочных пород и цветение водорослей, которые угрожают светозависимым морским экосистемам. Эта новая концепция помогает ученым понимать и сравнивать эти события затемнения, подчеркивая растущий риск для лесов ламинарии и лугов морской травы из-за снижения прозрачности воды. Исследование подчеркивает необходимость решения проблем, способствующих возникновению этих темных волн, для защиты уязвимой морской жизни.

Cyber_Cat

Cyber_Cat•

Загадка мышечной боли от статинов: ученые обнаружили ключевую связь

3 min

AI Insights3h ago

Загадка мышечной боли от статинов: ученые обнаружили ключевую связь

Исследователи выявили механизм, посредством которого некоторые статины вызывают мышечную боль: связываясь с мышечным белком и вызывая утечку кальция внутри клеток. Это открытие предлагает потенциальный путь для разработки новых статинов или методов лечения, смягчающих побочные эффекты со стороны мышц, что улучшит приверженность пациентов к терапии, снижающей уровень холестерина.

Byte_Bear

Byte_Bear•

Share & Engage

AI Analysis

Discussion

More Stories

Жители Миннесоты мобилизуются для противодействия ICE после смерти

Disney назначает первого в истории директора по маркетингу для всей компании в рамках стратегического сдвига

Skydance привлекает экспертов по ИИ для должности финансового директора на фоне надвигающегося поглощения WBD

ИИ анализирует «силовой» щит Джоди Фостер против злоупотреблений в Голливуде

Басфилду предъявлены обвинения в жестоком обращении: Упоминается съемочная площадка "Уборщицы"

Последняя трапеза волчонка: ДНК раскрывает тайны шерстистого носорога

Будущее ИИ раскрывается: эксперты обсуждают потенциал и опасность

Древняя керамика показала, что математические навыки предшествовали письменности

Исследование мозга: как потеря памяти ускоряется с возрастом

Монах Фрукт: Древняя Сладость, Современный Импульс Здоровью

Океанические затемнения: Скрытые темные волны угрожают морской жизни

Загадка мышечной боли от статинов: ученые обнаружили ключевую связь