Новая модель генерации изображений с открытым исходным кодом GLM-Image от Z.ai продемонстрировала превосходную производительность в рендеринге сложного текста в изображениях по сравнению с проприетарной моделью Nano Banana Pro от Google, также известной как Gemini 3 Pro Image. Модель с 16 миллиардами параметров, разработанная недавно вышедшим на биржу китайским стартапом Z.ai, предлагает новую альтернативу в области точной генерации изображений с большим количеством текста, категории, в которой ранее доминировали предложения с закрытым исходным кодом.
Появление GLM-Image происходит на фоне растущей популярности моделей ИИ, способных генерировать изображения со сложным текстом, что обусловлено спросом со стороны корпоративного сектора на такие приложения, как создание рекламных материалов, учебных материалов и фирменных канцелярских товаров. Nano Banana Pro от Google, часть семейства моделей ИИ Gemini 3, выпущенного в конце прошлого года, быстро завоевала популярность благодаря своей скорости и точности в этой области. Однако модель с открытым исходным кодом от Z.ai представляет собой убедительную альтернативу, потенциально демократизирующую доступ к передовым возможностям генерации изображений.
GLM-Image отличается от многих ведущих генераторов изображений тем, что использует гибридную авторегрессионную (AR) диффузионную конструкцию, отходя от отраслевого стандарта "чистой диффузии". Этот новый подход, согласно отчету VentureBeat Карла Франзена от 14 января 2026 года, позволил GLM-Image достичь результатов, которые ранее считались исключительной областью проприетарных моделей. Переход к гибридным архитектурам может сигнализировать о новом направлении в генерации изображений с помощью ИИ, потенциально открывая дальнейшие достижения в точности и контроле.
Последствия моделей с открытым исходным кодом, таких как GLM-Image, выходят за рамки простого технологического прогресса. Сделав сложные инструменты ИИ общедоступными, Z.ai вносит вклад в создание более справедливой среды, позволяя малым предприятиям, исследователям и частным лицам использовать передовые технологии генерации изображений. Это контрастирует с проприетарным характером таких моделей, как Nano Banana Pro и Claude Code от Anthropic, которые, будучи мощными, ограничивают доступ и использование.
Рост как проприетарных, так и моделей ИИ с открытым исходным кодом подчеркивает быстрые темпы инноваций в этой области. Конкуренция между моделями, такими как GLM-Image и Nano Banana Pro, вероятно, приведет к дальнейшему улучшению технологии генерации изображений, что принесет пользу пользователям в различных секторах. Поскольку ИИ продолжает проникать в различные аспекты общества, баланс между проприетарным подходом и подходом с открытым исходным кодом будет играть решающую роль в формировании его доступности и воздействия. Производительность GLM-Image была первоначально продемонстрирована на Fal.ai, платформе для развертывания и масштабирования моделей ИИ. Для полной оценки его возможностей и ограничений потребуются дальнейшие испытания и реальные приложения.
Discussion
Join the conversation
Be the first to comment