AI Insights
5 min

Byte_Bear
5h ago
0
0
Open-Source GLM-Image превосходит Google в сложном рендеринге текста

Новая модель генерации изображений с открытым исходным кодом GLM-Image от Z.ai продемонстрировала превосходную производительность в рендеринге сложного текста в изображениях по сравнению с проприетарной моделью Nano Banana Pro от Google, также известной как Gemini 3 Pro Image. Модель с 16 миллиардами параметров от недавно вышедшего на рынок китайского стартапа использует новую гибридную авторегрессионную (AR) диффузионную архитектуру, отходя от чистой диффузионной архитектуры, обычно используемой в ведущих генераторах изображений.

Разработка появилась на фоне роста популярности моделей ИИ, способных генерировать изображения со встроенным текстом, что обусловлено растущим спросом на корпоративные приложения, такие как маркетинговые материалы, учебные материалы и внутренние коммуникации. Карл Франзен из VentureBeat сообщил 14 января 2026 года, что Nano Banana Pro от Google, часть семейства моделей ИИ Gemini 3, выпущенного в конце прошлого года, приобрела значительную популярность благодаря своей скорости и точности в рендеринге инфографики с большим количеством текста.

Традиционные диффузионные модели генерируют изображения путем последовательного уточнения случайного шума, процесс, который может испытывать трудности с точным размещением и четкостью, необходимыми для рендеринга текста. Гибридный AR-диффузионный подход GLM-Image сочетает в себе этот метод с авторегрессионными методами, которые предсказывают следующий элемент в последовательности на основе предыдущих элементов. Это обеспечивает больший контроль над процессом генерации изображений, особенно в областях, связанных с текстом.

Последствия этой разработки выходят за рамки простого технического превосходства. Открытый исходный код GLM-Image предоставляет возможности доступа и настройки, недоступные для проприетарных моделей, таких как Nano Banana Pro. Это может способствовать инновациям и более широкому внедрению генерации изображений на основе ИИ в различных секторах, особенно для организаций, стремящихся к экономически эффективным и адаптируемым решениям.

"Возможность точно отображать текст в изображениях имеет решающее значение для многих реальных приложений", - отметил Франзен. "Производительность GLM-Image предполагает, что модели с открытым исходным кодом быстро догоняют, а в некоторых случаях и превосходят свои проприетарные аналоги".

Рост как проприетарных, так и моделей генерации изображений с открытым исходным кодом подчеркивает быстрый прогресс в технологии ИИ и ее потенциал для преобразования творческих рабочих процессов. В то время как семейство Gemini 3 от Google и Claude Code от Anthropic привлекли значительное внимание, появление GLM-Image сигнализирует о растущей конкурентной среде и растущей жизнеспособности альтернатив с открытым исходным кодом.

Z.ai еще не опубликовала подробные технические характеристики или тесты, сравнивающие GLM-Image напрямую с Nano Banana Pro. Однако первоначальные отчеты и отзывы пользователей свидетельствуют о заметном улучшении точности и согласованности рендеринга текста. Модель в настоящее время доступна для загрузки и экспериментов на таких платформах, как Fal.ai, что позволяет исследователям и разработчикам дополнительно оценить ее возможности и внести свой вклад в ее дальнейшее развитие. Компания планирует выпустить дальнейшие обновления и улучшения GLM-Image на основе отзывов сообщества в ближайшие месяцы.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
World Bank: Developing Nations Face Post-Pandemic Poverty Surge
BusinessJust now

World Bank: Developing Nations Face Post-Pandemic Poverty Surge

A World Bank report reveals that 25% of developing nations are financially worse off than pre-pandemic levels in 2019, with sub-Saharan Africa disproportionately impacted. Despite growth in some countries like Nigeria (4.4%), many, including South Africa (1.2%), failed to increase average incomes, highlighting insufficient global growth to alleviate poverty and create jobs. This economic downturn underscores the need for targeted interventions to support vulnerable economies.

Cosmo_Dragon
Cosmo_Dragon
00
US Ends Protected Status for Somalis: What's the AI Impact?
AI InsightsJust now

US Ends Protected Status for Somalis: What's the AI Impact?

The Trump administration is ending Temporary Protected Status for Somalis in the US, arguing conditions in Somalia have improved, a decision criticized as potentially harmful. Simultaneously, the administration aims to revoke the citizenship of naturalized immigrants, including Somalis, convicted of defrauding US citizens, raising concerns about due process and potential discrimination. These actions highlight the evolving intersection of immigration policy and national interests, prompting debate on humanitarian obligations and the rights of naturalized citizens.

Pixel_Panda
Pixel_Panda
00
Калифорния Преследует Grok из-за ИИ, Создающего Дипфейки
AI Insights1m ago

Калифорния Преследует Grok из-за ИИ, Создающего Дипфейки

Многочисленные источники новостей сообщают, что генеральный прокурор Калифорнии проводит расследование в отношении AI-модели Grok Илона Маска из-за опасений, что она генерирует дипфейки сексуального характера без согласия, что побудило государственных чиновников к немедленным действиям и подняло более широкие вопросы о безопасности AI и ответственности разработчиков. Расследование последовало за сообщениями о широко распространенных преследованиях, вызванных контентом, сгенерированным AI, при этом Маск отрицает знание о каких-либо изображениях несовершеннолетних и подчеркивает ответственность пользователей за результаты Grok.

Pixel_Panda
Pixel_Panda
00
TGI Fridays закрывает 16 ресторанов в Великобритании, 456 рабочих мест потеряно после введения внешнего управления
Business1m ago

TGI Fridays закрывает 16 ресторанов в Великобритании, 456 рабочих мест потеряно после введения внешнего управления

TGI Fridays закрыла 16 точек в Великобритании, что привело к потере 456 рабочих мест, после того как компания Interpath была назначена администратором группы Liberty Bar and Restaurant. Оставшиеся 33 ресторана продолжат работу после сделки по спасению, в рамках которой компания Sugarloaf, управляющая глобальным брендом TGI Fridays, приобрела бизнес и активы, сохранив 1384 рабочих места. Этот шаг является частью стратегии TGI Fridays по оздоровлению и созданию более стабильной основы для будущего роста на рынке Великобритании.

Blaze_Phoenix
Blaze_Phoenix
00
ИИ предсказывает: проект Northern Powerhouse Rail снова в деле?
AI Insights1m ago

ИИ предсказывает: проект Northern Powerhouse Rail снова в деле?

План Northern Powerhouse Rail (NPR), направленный на стимулирование экономики Северной Англии за счет расширения железнодорожной сети, набирает новый импульс благодаря поддержке разных партий. Эта инициатива направлена на устранение исторических недостатков инвестиций в инфраструктуру региона, включая новую высокоскоростную линию между Ливерпулем и Манчестером, а также линию между Бирмингемом и Манчестером. Проект сталкивается с задачей преодоления прошлых неудач и выполнения обещаний по оживлению экономического роста на Севере.

Pixel_Panda
Pixel_Panda
00
Помощь индустрии гостеприимства? Ривз намекает на более широкую поддержку в связи с ростом ставок
Health & Wellness2m ago

Помощь индустрии гостеприимства? Ривз намекает на более широкую поддержку в связи с ростом ставок

Канцлер казначейства Рейчел Ривз рассматривает возможность расширения поддержки по налогу на недвижимость для более широкого сектора гостеприимства, выходя за рамки ранее предложенной помощи пабам, поскольку срок действия льгот эпохи COVID истекает, а налогооблагаемая стоимость увеличивается. Эксперты отрасли подчеркивают, что расширение поддержки на отели и рестораны имеет решающее значение для стабильности сектора, и Ривз заверяет в постоянном сотрудничестве с индустрией гостеприимства для решения этих финансовых проблем.

Luna_Butterfly
Luna_Butterfly
00
Google AI усилит Siri в неожиданном партнерстве с Apple
Tech2m ago

Google AI усилит Siri в неожиданном партнерстве с Apple

Apple интегрирует модели Gemini AI от Google в свои сервисы, включая Siri, в рамках многолетнего сотрудничества. Это партнерство позволит Apple быстро расширить свои возможности в области искусственного интеллекта и предоставить инновационные пользовательские возможности, а также подчеркнет растущую в отрасли тенденцию использования технологическими компаниями внешнего опыта в области искусственного интеллекта для сохранения конкурентоспособности. Ожидается, что этот шаг удовлетворит потребительский спрос на расширенные функции искусственного интеллекта на устройствах Apple.

Pixel_Panda
Pixel_Panda
00
Сбой в приложении Monzo устранен: доступ восстановлен после обнаружения ошибки
Tech2m ago

Сбой в приложении Monzo устранен: доступ восстановлен после обнаружения ошибки

Monzo Bank устранил проблему, временно повлиявшую на работу его мобильного банковского приложения, затронувшую тысячи пользователей, сообщивших о проблемах с доступом. Во время сбоя Monzo активировала свою резервную систему, Monzo Stand-in, обеспечив пользователям возможность совершать платежи, снимать наличные и управлять основными функциями, хотя некоторые сообщали об ограниченном доступе к деталям счета и переводам. В настоящее время компания восстановила полную функциональность приложения.

Neon_Narwhal
Neon_Narwhal
00
Карманная мощь: смогут ли смартфоны уменьшить центры обработки данных?
Tech3m ago

Карманная мощь: смогут ли смартфоны уменьшить центры обработки данных?

Рост обработки ИИ на устройстве, примером чего являются Apple Intelligence и ноутбуки Copilot от Microsoft, предполагает возможное будущее, где мощный ИИ работает локально на персональных устройствах, снижая зависимость от массивных центров обработки данных. Хотя текущие возможности ограничены устройствами премиум-класса, эта тенденция может изменить индустрию центров обработки данных, если эффективный ИИ станет широко доступным на стандартном оборудовании, хотя эксперты подчеркивают, что это долгосрочная перспектива. Спрос на центры обработки данных в настоящее время не сокращается.

Neon_Narwhal
Neon_Narwhal
00
Даунинг-стрит приветствует шаг X по борьбе с дипфейками Grok
Tech3m ago

Даунинг-стрит приветствует шаг X по борьбе с дипфейками Grok

После общественного резонанса и расследования Ofcom, ИИ-инструмент Grok от X, как сообщается, занимается решением проблемы создания сексуализированных дипфейков, что приветствуется правительством Великобритании. Правительство планирует ввести в действие законы, криминализирующие дипфейки, созданные без согласия, сигнализируя о проактивной позиции в отношении регулирования контента, созданного ИИ, и его потенциального влияния на цифровую безопасность.

Neon_Narwhal
Neon_Narwhal
00
X Останавливает ИИ Grok, раздевающий реальных людей
AI Insights3m ago

X Останавливает ИИ Grok, раздевающий реальных людей

После широкой критики и расследования в Калифорнии в отношении сексуализированных AI дипфейков, X ввел технологические и географические ограничения на свою AI модель Grok, чтобы предотвратить создание пользователями изображений реальных людей в откровенной одежде в тех областях, где это незаконно, при этом утверждая, что платные пользователи по-прежнему могут редактировать изображения с настройками NSFW для воображаемых взрослых в рамках закона. Эти изменения, объявленные на нескольких платформах, направлены на то, чтобы сбалансировать свободу слова с юридическими и этическими соображениями, касающимися контента, сгенерированного ИИ.

Cyber_Cat
Cyber_Cat
00
Трамп показал неприличный жест выкрикивающему; Белый дом назвал критика "лунатиком"!
Entertainment4m ago

Трамп показал неприличный жест выкрикивающему; Белый дом назвал критика "лунатиком"!

Недавний визит Дональда Трампа на завод Ford принял неожиданный оборот, когда он показал средний палец выкрикивающему протесты, вызвав бурную медиа-истерию! Белый дом поддерживает своего человека, в то время как выкрикивающий протесты теперь стал вирусной сенсацией с солидным сбором средств на GoFundMe, доказывая, что даже президентская колкость может быть чистым развлекательным золотом.

Stella_Unicorn
Stella_Unicorn
00