কার্ল ফ্রানজেন ৩০ জানুয়ারি, ২০২৬ ক্রেডিট: ভেঞ্চারবিট, ফ্যাল.এআই-এর ওপর ফ্লাক্স-১ দিয়ে তৈরি।সান ফ্রান্সিসকো-ভিত্তিক এআই ল্যাব আর্সি গত বছর একদম শুরু থেকে বৃহৎ ভাষা মডেল (এলএলএম) প্রশিক্ষণ দেওয়া এবং উন্মুক্ত অথবা আংশিকভাবে উন্মুক্ত উৎসের লাইসেন্সের অধীনে জনসাধারণের জন্য প্রকাশ করার কারণে আলোচনার জন্ম দেয়। এর ফলে ডেভেলপার, একক উদ্যোক্তা এবং এমনকি মাঝারি থেকে বৃহৎ আকারের উদ্যোগগুলো বিনামূল্যে শক্তিশালী এআই মডেল ব্যবহার করতে এবং নিজেদের ইচ্ছেমতো কাস্টমাইজ করতে পারে।আর্সি এই সপ্তাহে তাদের সবচেয়ে বড়, সবচেয়ে কার্যকরী উন্মুক্ত ভাষা মডেল নিয়ে আবার ফিরে এসেছে: ট্রিনিটি লার্জ, একটি ৪০০ বিলিয়ন প্যারামিটারের মিক্সচার-অফ-এক্সপার্টস (MoE), যা এখন প্রিভিউতে পাওয়া যাচ্ছে।ফ্ল্যাগশিপ প্রকাশের পাশাপাশি, আর্সি একটি "র" চেকপয়েন্ট মডেল, ট্রিনিটি-লার্জ-ট্রুবেস সরবরাহ করছে, যা গবেষকদের শুধুমাত্র কাঁচা ডেটা থেকে একটি ৪০০বি স্পার্স MoE কী শেখে, তা অধ্যয়ন করতে দেয়, নির্দেশনার সুর এবং রিইনফোর্সমেন্ট প্রয়োগ করার আগে।১০ ট্রিলিয়ন টোকেনের চিহ্নে একটি পরিষ্কার স্লেট সরবরাহ করে, আর্সি অত্যন্ত নিয়ন্ত্রিত শিল্পগুলোতে এআই নির্মাতাদের খাঁটি নিরীক্ষণ করতে এবং একটি সাধারণ-উদ্দেশ্যের চ্যাট মডেলের "ব্ল্যাক বক্স" পক্ষপাত বা বিন্যাসের অদ্ভুততা উত্তরাধিকার সূত্রে না পেয়ে তাদের নিজস্ব বিশেষ সারিবদ্ধকরণ পরিচালনা করতে সক্ষম করে। এই স্বচ্ছতা একটি মডেলের অন্তর্নিহিত যুক্তিবোধের ক্ষমতা এবং পোস্ট-ট্রেনিংয়ের চূড়ান্ত পর্যায়ে যুক্ত হওয়া সহায়ক আচরণগুলোর মধ্যেকার পার্থক্য সম্পর্কে গভীর ধারণা দেয়।এই লঞ্চটি আলিবাবা (কুইন), জেড.এআই (জিপু), ডিপসিক, মো-এর মতো শক্তিশালী চীনা ওপেন-সোর্স এলএলএম বিকল্প আসার সময় হলো।
Discussion
Join the conversation
Be the first to comment