আলিবাবার Qwen টিম ৩১শে ডিসেম্বর, ২০২৫ তারিখে Qwen-Image-2512 উন্মোচন করেছে, যা গুগল-এর মালিকানাধীন ন্যানো বানানা প্রো (জেমিনি ৩ প্রো ইমেজ)-এর বিকল্প হিসেবে একটি ওপেন-সোর্স এআই ইমেজ মডেল। এই উন্মোচন ডেভেলপার এবং বাণিজ্যিক ব্যবহারের জন্য আগ্রহী সংস্থাগুলির জন্য Apache 2.0 লাইসেন্সের অধীনে একটি অবাধ বিকল্প সরবরাহ করে।
গুগলের নভেম্বরে ন্যানো বানানা প্রো উন্মোচনের পর এটি প্রকাশিত হয়েছে, যা এআই ইমেজ জেনারেশনের জন্য একটি নতুন মান নির্ধারণ করেছে, বিশেষ করে ঘন, টেক্সট-ভারী ভিজ্যুয়াল যেমন ইনফোগ্রাফিক্স এবং নির্ভুল টেক্সট রেন্ডারিং সহ স্লাইড তৈরি করার ক্ষেত্রে। ভেঞ্চারবিটের কার্ল ফ্রানজেন উল্লেখ করেছেন যে ন্যানো বানানা প্রো একটি উল্লেখযোগ্য অগ্রগতি হলেও, এর মালিকানাধীন প্রকৃতি, ক্লাউড নির্ভরতা এবং প্রিমিয়াম মূল্য সেই সংস্থাগুলির জন্য এর অ্যাক্সেসযোগ্যতাকে সীমিত করে, যাদের অনুমানযোগ্য খরচ, ডেটা সার্বভৌমত্ব বা আঞ্চলিক স্থানীয়করণের প্রয়োজন।
Qwen-Image-2512 একটি ওপেন-সোর্স সমাধান প্রদানের মাধ্যমে এই সীমাবদ্ধতাগুলি দূর করে। Qwen চ্যাটের মাধ্যমে গ্রাহকদের জন্য মডেলটি অ্যাক্সেসযোগ্য, এবং এর সম্পূর্ণ ওপেন-সোর্স ওয়েটগুলি Hugging Face এবং ModelScope-এর মতো প্ল্যাটফর্মে উপলব্ধ, যা পরিদর্শন এবং পরিবর্তনের সুযোগ দেয়। এই উন্মুক্ত অ্যাক্সেসযোগ্যতা একটি মূল পার্থক্যকারী বৈশিষ্ট্য, যা ডেভেলপারদের নির্দিষ্ট চাহিদা অনুসারে মডেলটিকে মানিয়ে নিতে এবং মালিকানাধীন লাইসেন্সের সীমাবদ্ধতা ছাড়াই বিভিন্ন অ্যাপ্লিকেশনে সংহত করতে সক্ষম করে।
Qwen-Image-2512 এবং ন্যানো বানানা প্রো-এর মতো এআই ইমেজ মডেলগুলি জটিল অ্যালগরিদম ব্যবহার করে, যা প্রায়শই ডিপ লার্নিং-এর উপর ভিত্তি করে তৈরি, টেক্সচুয়াল বর্ণনাকে ভিজ্যুয়াল উপস্থাপনায় অনুবাদ করতে। এই মডেলগুলিকে ছবি এবং টেক্সটের বিশাল ডেটাসেটের উপর প্রশিক্ষণ দেওয়া হয়, যা শব্দ এবং বাক্যাংশগুলিকে সংশ্লিষ্ট ভিজ্যুয়াল উপাদানগুলির সাথে যুক্ত করতে শেখে। স্বাভাবিক ভাষার প্রম্পট থেকে নির্ভুল এবং বিস্তারিত ছবি তৈরি করার ক্ষমতা বিভিন্ন শিল্পের জন্য তাৎপর্যপূর্ণ, যার মধ্যে রয়েছে মার্কেটিং, শিক্ষা এবং ডিজাইন।
Qwen-Image-2512-এর ওপেন-সোর্স প্রকৃতি এআই সম্প্রদায়ের মধ্যে উদ্ভাবন এবং সহযোগিতাকে উৎসাহিত করতে পারে। মডেলটির কোড এবং ডেটা অবাধে উপলব্ধ করার মাধ্যমে, আলিবাবা গবেষক এবং ডেভেলপারদের এর উন্নতিতে অবদান রাখতে এবং নতুন অ্যাপ্লিকেশনগুলি অন্বেষণ করতে উৎসাহিত করে। এই সহযোগী পদ্ধতিটি মালিকানাধীন মডেলগুলির বদ্ধ ইকোসিস্টেমের সাথে বৈপরীত্য তৈরি করে, যেখানে উদ্ভাবন প্রায়শই একটি একক কোম্পানির মধ্যে সীমাবদ্ধ থাকে।
Qwen-Image-2512-এর উন্মোচন এআই ল্যান্ডস্কেপে একটি গুরুত্বপূর্ণ অগ্রগতি চিহ্নিত করে, যা মালিকানাধীন ইমেজ জেনারেশন মডেলগুলির একটি কার্যকর ওপেন-সোর্স বিকল্প সরবরাহ করে। একটি অবাধ লাইসেন্সের অধীনে এর সহজলভ্যতা উন্নত এআই প্রযুক্তিতে অ্যাক্সেসকে আরও সহজলভ্য করতে পারে এবং এই ক্ষেত্রে উদ্ভাবনকে ত্বরান্বিত করতে পারে। Qwen টিমের ওপেন-সোর্স এআই সম্প্রদায়ে ক্রমাগত অবদান আরও অগ্রগতি চালাবে এবং এআই বিকাশের ভবিষ্যৎ গঠনে সহায়ক হবে বলে আশা করা যায়।
Discussion
Join the conversation
Be the first to comment