কৃত্রিম বুদ্ধিমত্তা-চালিত স্পিচ রিকগনিশন মডেলগুলি উন্নতি করছে, নেটিভ এবং ব্রাউজার-ভিত্তিক উভয় অ্যাপ্লিকেশনগুলির জন্যই নতুন প্রয়োগ দেখা যাচ্ছে। একই সাথে, লন্ডনের একটি স্টার্টআপ এনার্জি লেনদেনকে নতুন রূপ দিতে এআই ব্যবহার করছে, যা সম্প্রসারণের জন্য উল্লেখযোগ্য তহবিল সংগ্রহ করেছে। এই উন্নয়নগুলি বিভিন্ন খাতে কৃত্রিম বুদ্ধিমত্তার দ্রুত অগ্রগতি এবং বিবিধ প্রয়োগের ওপর আলোকপাত করে।
মিস্ট্রালের ভক্সট্রাল মিনি ৪বি রিয়েলটাইম মডেলের একটি খাঁটি রাস্ট (Rust) সংস্করণ, "voxtral-mini-realtime-rs" নামে GitHub-এ প্রকাশিত হয়েছে, যা নেটিভ এবং ব্রাউজারে স্ট্রিমিং স্পিচ রিকগনিশন-এর সুবিধা দেয়। বার্ন এমএল ফ্রেমওয়ার্ক ব্যবহার করে তৈরি এই সংস্করণটি Q4 GGUF কোয়ান্টাইজড পাথ (২.৫ জিবি) সম্পূর্ণরূপে ক্লায়েন্ট-সাইডে WASM WebGPU-এর মাধ্যমে একটি ব্রাউজার ট্যাবে চালাতে সক্ষম করে। হ্যাকার নিউজ (সূত্র ১) অনুসারে, ব্যবহারকারীরা এটি সরাসরি চেষ্টা করতে পারেন। প্রকল্পটি নেটিভ সিএলআই ব্যবহারের জন্য একটি দ্রুত শুরু করার নির্দেশিকা সরবরাহ করে, যার মধ্যে মডেলের ওজন ডাউনলোড করা এবং অডিও ফাইল ট্রান্সক্রাইব করা অন্তর্ভুক্ত।
আরেকটি উন্নয়ন হলো, মিস্ট্রাল এআই-এর ভক্সট্রাল রিয়েলটাইম ৪বি মডেলের একটি খাঁটি সি (C) সংস্করণও GitHub-এ উপলব্ধ করা হয়েছে (সূত্র ২)। এই সংস্করণে সি স্ট্যান্ডার্ড লাইব্রেরি ছাড়া অন্য কোনো বাহ্যিক নির্ভরতা নেই এবং এতে MPS ইনফারেন্স অন্তর্ভুক্ত রয়েছে। অডিও প্রক্রিয়াকরণে ওভারল্যাপিং উইন্ডো সহ একটি chunked এনকোডার ব্যবহার করা হয়, যা ইনপুট দৈর্ঘ্যের নির্বিশেষে মেমরি ব্যবহার পরিচালনা করে। সি সংস্করণটি stdin বা লাইভ মাইক্রোফোন ক্যাপচার থেকে অডিও ইনপুটও সমর্থন করে, যা বিভিন্ন ফরম্যাটকে ট্রান্সকোড এবং ট্রান্সক্রাইব করা সহজ করে তোলে। একটি স্ট্রিমিং সি এপিআই (voxstreamt) অন্তর্ভুক্ত করা হয়েছে, যা ইনক্রিমেন্টাল অডিও ইনপুট এবং টোকেন স্ট্রিং আউটপুট সরবরাহ করে।
এনার্জি সেক্টরে, লন্ডন-ভিত্তিক স্টার্টআপ টেম (Tem) ৭৫ মিলিয়ন ডলারের একটি সিরিজ বি ফান্ডিং রাউন্ড সুরক্ষিত করেছে, যা কোম্পানিটিকে ৩০০ মিলিয়ন ডলারের বেশি মূল্যায়ন করেছে, টেকক্রাঞ্চ (সূত্র ৫) অনুসারে। টেম এনার্জি লেনদেনকে অপটিমাইজ করতে এআই ব্যবহার করে এবং বর্তমানে ২,৬০০-এর বেশি ইউকে ব্যবসায়ীকে পরিষেবা দেয়, যা সম্ভাব্য এনার্জি বিল সাশ্রয় করে। কোম্পানিটি টেক্সাস থেকে শুরু করে মার্কিন যুক্তরাষ্ট্র এবং অস্ট্রেলিয়ায় প্রসারিত করার পরিকল্পনা করছে, যার চূড়ান্ত লক্ষ্য হলো পাবলিক হওয়া।
এই উন্নয়নগুলি এআই অগ্রগতির বৃহত্তর প্রেক্ষাপটে এসেছে। অন্যান্য খবরে রয়েছে ডিসকর্ডের বিশ্বব্যাপী বয়স যাচাইকরণ, বিনোদনমূলক ট্রেইলার প্রকাশ এবং 3D-প্রিন্টেড হুইসেল-এর ব্যবহার (সূত্র ৪)। এই উদাহরণগুলি এআই এবং সংশ্লিষ্ট প্রযুক্তিগুলির বিস্তৃত প্রভাবকে তুলে ধরে।
Discussion
AI Experts & Community
Be the first to comment