ভেঞ্চারবিটের মতে, Z.ai একটি নতুন ওপেন-সোর্স ইমেজ জেনারেশন মডেল, GLM-Image চালু করেছে, যা Google-এর ন্যানো ব্যানানা প্রো-এর মতো মালিকানাধীন সিস্টেমগুলোর সাথে প্রতিদ্বন্দ্বিতা করতে সক্ষম। এই মডেলটি ছবির মধ্যে জটিল টেক্সট রেন্ডার করার ক্ষেত্রে অসাধারণ দক্ষতা দেখিয়ে নিজেকে আলাদা করেছে, যা এন্টারপ্রাইজ অ্যাপ্লিকেশনগুলোর জন্য একটি বিকল্প প্রস্তাব করতে পারে।
এই সপ্তাহে প্রকাশিত GLM-Image তার টেক্সট-রেন্ডারিং সক্ষমতা অর্জনের জন্য একটি হাইব্রিড আর্কিটেকচার ব্যবহার করে। এই উন্নয়ন AI ইমেজ জেনারেশন স্পেসে ওপেন-সোর্স সমাধানের দিকে ক্রমবর্ধমান প্রবণতার ইঙ্গিত দেয়।
Google-এর ন্যানো ব্যানানা প্রো (যা জেমিনি ৩ প্রো ইমেজ নামেও পরিচিত), যা গত বছরের শেষের দিকে প্রকাশিত জেমিনি ৩ AI মডেল পরিবারের অংশ, টেক্সট-ভারী ইনফোগ্রাফিক তৈরি করার গতি এবং নির্ভুলতার জন্য জনপ্রিয়তা লাভ করেছে। এই সক্ষমতাগুলো এটিকে কোলাটেরাল, ট্রেনিং উপকরণ, অনবোর্ডিং ডকুমেন্ট এবং স্টেশনারি তৈরির জন্য উপযুক্ত করে তোলে।
যদিও GLM-Image একটি আকর্ষণীয় ওপেন-সোর্স বিকল্প উপস্থাপন করে, তবে ভেঞ্চারবিট উল্লেখ করেছে যে এর ব্যবহারিক নির্ভুলতা এখনও ভিন্ন হতে পারে। GLM-Image এবং জেমিনি ৩ পরিবারের উত্থান, অ্যানথ্রোপিকের ক্লড কোডের সাথে, ২০২৬ সালে AI সেক্টরে দ্রুত অগ্রগতি এবং ব্যবহারকারীর ক্রমবর্ধমান গ্রহণযোগ্যতা তুলে ধরে।
Discussion
Join the conversation
Be the first to comment