আলিবাবার নতুন Qwen 3.5 মডেল এন্টারপ্রাইজ এআই-এর বাজারে আলোড়ন সৃষ্টি করছে, যা তাদের নিজস্ব ফ্ল্যাগশিপ মডেলের বিরুদ্ধে বেঞ্চমার্ক জিতেছে, যেখানে খরচ অনেক কম, এমনটাই জানাচ্ছে VentureBeat। চন্দ্র নববর্ষের প্রাক্কালে এই প্রকাশ, ২০২৬ সালের জন্য এআই অবকাঠামো মূল্যায়নকারী আইটি নেতাদের জন্য একটি গুরুত্বপূর্ণ মুহূর্ত। একই সময়ে, Anthropic Claude Sonnet 4.6 প্রকাশ করেছে, যা মাঝারি দামের মধ্যে প্রায় ফ্ল্যাগশিপ মানের বুদ্ধি সরবরাহ করে, এবং Google DeepMind বৃহৎ ভাষা মডেলগুলির নৈতিক আচরণের আরও বেশি নিরীক্ষণের আহ্বান জানাচ্ছে।
Qwen 3.5, যাতে ৩৯৭ বিলিয়ন মোট প্যারামিটার রয়েছে, তবে প্রতি টোকেনে মাত্র ১৭ বিলিয়ন সক্রিয় থাকে, Alibaba-র আগের ফ্ল্যাগশিপ, Qwen3-Max-এর বিরুদ্ধে বেঞ্চমার্ক জিতেছে বলে জানা গেছে, VentureBeat জানিয়েছে। কোম্পানিটি স্বীকার করেছে যে এই মডেলটিতে এক ট্রিলিয়নের বেশি প্যারামিটার ছিল। এটি এন্টারপ্রাইজ এআই ক্রেতাদের জন্য একটি আকর্ষণীয় যুক্তি উপস্থাপন করে, যা ইঙ্গিত করে যে তারা যে মডেলটি চালাতে, নিজের অধিকারে রাখতে এবং নিয়ন্ত্রণ করতে পারে, তা এখন আরও ব্যয়বহুল বিকল্পগুলির সাথে প্রতিযোগিতা করতে পারে।
মঙ্গলবার প্রকাশিত Anthropic-এর Claude Sonnet 4.6, মাঝারি দামের মধ্যে প্রায় ফ্ল্যাগশিপ মানের বুদ্ধি সরবরাহ করে এন্টারপ্রাইজ গ্রহণকে ত্বরান্বিত করতে প্রস্তুত। মডেলটিতে বিটাতে ১ মিলিয়ন টোকেন কন্টেক্সট উইন্ডো রয়েছে এবং বর্তমানে claude.ai এবং Claude Cowork-এ ডিফল্ট মডেল হিসেবে ব্যবহৃত হচ্ছে। VentureBeat-এর মতে, দাম স্থিতিশীল রয়েছে, প্রতি মিলিয়ন টোকেনের জন্য $315, যা এর পূর্বসূরি, Sonnet 4.5-এর মতোই। "এটি মাঝারি দামের মধ্যে প্রায় ফ্ল্যাগশিপ মানের বুদ্ধি সরবরাহ করে এবং অভূতপূর্ব কর্পোরেট দৌড়ে এআই এজেন্ট এবং স্বয়ংক্রিয় কোডিং সরঞ্জাম স্থাপন করার ক্ষেত্রে সরাসরি অবস্থান করে," VentureBeat উল্লেখ করেছে।
এই অগ্রগতিগুলি এমন সময়ে এসেছে যখন শিল্প উচ্চ-ঝুঁকিপূর্ণ ডোমেইনে এআই স্থাপন করার জটিলতাগুলির সাথে লড়াই করছে। উদাহরণস্বরূপ, LexisNexis নির্ভুলতা, প্রাসঙ্গিকতা, কর্তৃত্ব এবং উদ্ধৃতি নির্ভুলতার প্রয়োজনীয়তা মেটাতে স্ট্যান্ডার্ড রিট্রিভাল-অগমেন্টেড জেনারেশন (RAG) থেকে গ্রাফ RAG এবং এজেন্টিক গ্রাফ-এর দিকে এগিয়েছে, যেমনটি VentureBeat-এ জানানো হয়েছে। VentureBeat-এর মতে, "নিখুঁত এআই বলে কিছু নেই কারণ আপনি কখনই ১০০% নির্ভুলতা বা ১০০% প্রাসঙ্গিকতা পাবেন না, বিশেষ করে জটিল, উচ্চ-ঝুঁকিপূর্ণ ডোমেইনগুলিতে যেমন আইনগত ক্ষেত্রে।"
এদিকে, Google DeepMind বৃহৎ ভাষা মডেলগুলির নৈতিক আচরণের আরও বেশি নিরীক্ষণের পক্ষে কথা বলছে। যেহেতু এলএলএমগুলি উন্নত হচ্ছে এবং সহযোগী, থেরাপিস্ট এবং চিকিৎসা পরামর্শদাতার মতো আরও সংবেদনশীল ভূমিকা গ্রহণ করছে, Google DeepMind নিশ্চিত করতে চায় যে প্রযুক্তিটি নির্ভরযোগ্য। Google DeepMind-এর একজন গবেষণা বিজ্ঞানী উইলিয়াম আইজ্যাক, এমআইটি টেকনোলজি রিভিউকে বলেছেন, "কোডিং এবং গণিতের ক্ষেত্রে, আপনার সুস্পষ্ট, সঠিক উত্তর রয়েছে যা আপনি পরীক্ষা করতে পারেন।"
AI Experts & Community
Be the first to comment