আবু ধাবির টেকনোলজি ইনোভেশন ইনস্টিটিউট (TII) ফ্যালকন H1R 7B উন্মোচন করেছে, যা ৭ বিলিয়ন প্যারামিটারের একটি ভাষা মডেল। সংস্থাটি দাবি করেছে, যুক্তিনির্ভর কাজের ক্ষেত্রে এটি প্রায় সাতগুণ বড় মডেলের সঙ্গে প্রতিদ্বন্দ্বিতা করতে এবং তাদের চেয়ে ভালো ফল করতে সক্ষম। এই মডেলটি জেনারেটিভ এআই উন্নয়নের প্রচলিত ধারাকে চ্যালেঞ্জ করে, যেখানে যুক্তিনির্ভর ক্ষমতা বাড়ানোর জন্য মূলত মডেলের আকার বাড়ানোর ওপর জোর দেওয়া হয়েছে।
TII-এর মতে, ফ্যালকন H1R 7B একটি হাইব্রিড আর্কিটেকচার ব্যবহারের মাধ্যমে এই পারফরম্যান্স অর্জন করেছে, যা এই ক্ষেত্রে স্ট্যান্ডার্ড হয়ে ওঠা বিশুদ্ধ ট্রান্সফরমার আর্কিটেকচার থেকে সরে এসেছে। এই আর্কিটেকচারাল পরিবর্তনের কারণে ছোট মডেলটি জটিল লজিক্যাল ডিডাকশন এবং গাণিতিক প্রমাণে আলিবাবার Qwen (32B) এবং Nvidia-র Nemotron (47B)-এর মতো বড় মডেলগুলোর সঙ্গে প্রতিযোগিতা করতে এবং এমনকি তাদের ছাড়িয়ে যেতে পারে।
ফ্যালকন H1R 7B-এর প্রকাশ ওপেন-ওয়েট এআই সম্প্রদায়ের জন্য একটি গুরুত্বপূর্ণ অগ্রগতি হিসেবে বিবেচিত হচ্ছে। এটি ইঙ্গিত দেয় যে আর্কিটেকচারাল উদ্ভাবন এবং ইনফারেন্স-টাইম স্কেলিং ক্রমশ গুরুত্বপূর্ণ হয়ে উঠছে, যা কেবল একটি মডেলের প্যারামিটারের সংখ্যা বাড়ানোর দিক থেকে মনোযোগ সরিয়ে আনছে। সম্পূর্ণ মডেল কোডটি Hugging Face-এ পাওয়া যাচ্ছে এবং ব্যক্তিরা Falcon Chat-এর মাধ্যমে লাইভ ডেমো ইনফারেন্সে মডেলটি পরীক্ষা করতে পারবেন, যা একটি চ্যাটবট প্ল্যাটফর্ম।
গত দুই বছর ধরে, জেনারেটিভ এআই ক্ষেত্রটি মূলত এই ধারণার অধীনে পরিচালিত হয়েছে যে বড় মডেল মানেই আরও ভালো যুক্তিনির্ভর ক্ষমতা। যেখানে ছোট মডেলগুলো (১০ বিলিয়ন প্যারামিটারের নিচে) কথোপকথন চালানোর ক্ষমতা প্রদর্শন করেছে, সেখানে তারা প্রায়শই আরও জটিল যুক্তিনির্ভর কাজের সঙ্গে লড়াই করেছে। TII-এর ফ্যালকন H1R 7B এই ধারণাকে চ্যালেঞ্জ করে প্রমাণ করেছে যে একটি ছোট, আরও দক্ষতার সঙ্গে ডিজাইন করা মডেল তুলনামূলক বা আরও ভালো পারফরম্যান্স অর্জন করতে পারে।
এই উন্নয়নের প্রভাব সুদূরপ্রসারী হতে পারে। যদি ছোট মডেলগুলো বড় মডেলগুলোর মতোই পারফরম্যান্স অর্জন করতে পারে, তবে এআই সিস্টেমকে প্রশিক্ষণ এবং স্থাপন করার জন্য প্রয়োজনীয় কম্পিউটেশনাল রিসোর্স কমে যেতে পারে, যা তাদের আরও সহজলভ্য এবং টেকসই করে তুলবে। ফ্যালকন H1R 7B-এর প্রকাশ জেনারেটিভ এআই-এর বিকাশে একটি সম্ভাব্য বাঁক চিহ্নিত করে, যা ইঙ্গিত দেয় যে আর্কিটেকচার এবং দক্ষতার উদ্ভাবন মডেলের আকার বাড়ানোর মতোই গুরুত্বপূর্ণ হতে পারে।
Discussion
Join the conversation
Be the first to comment