এআই অগ্রগতি জালিয়াতি এবং স্পিচ রিকগনিশন চ্যালেঞ্জ মোকাবেলা করছে
নিউ ইয়র্ক - ১০ ফেব্রুয়ারি, ২০২৬ - কৃত্রিম বুদ্ধিমত্তা জালিয়াতি শনাক্তকরণ এবং স্পিচ রিকগনিশন উভয় ক্ষেত্রেই উল্লেখযোগ্য অগ্রগতি সাধন করছে, নতুন মডেলগুলি চিত্তাকর্ষক গতি এবং দক্ষতা প্রদান করছে। মাস্টারকার্ডের ডিসিশন ইন্টেলিজেন্স প্রো (ডিআই প্রো) এআই ব্যবহার করে পৃথক লেনদেন বিশ্লেষণ করে এবং কয়েক মিলিসেকেন্ডের মধ্যে সন্দেহজনক কার্যকলাপ সনাক্ত করছে, যেখানে ওপেন-সোর্স প্রকল্পগুলি রিয়েল-টাইম স্পিচ-টু-টেক্সট ক্ষমতা সক্ষম করছে।
মাস্টারকার্ডের ডিআই প্রো, একটি প্রধান জালিয়াতি প্ল্যাটফর্ম, আর্থিক জালিয়াতির ক্রমবর্ধমান জটিলতা মোকাবেলা করার জন্য ডিজাইন করা হয়েছে। মাস্টারকার্ডের জোহান Gerber-এর মতে, প্ল্যাটফর্মটি প্রতিটি লেনদেনের সাথে সম্পর্কিত ঝুঁকি মূল্যায়নের উপর দৃষ্টি নিবদ্ধ করে। মাস্টারকার্ডের কার্যক্রমের বিশালতা বিবেচনা করে এটি অত্যন্ত গুরুত্বপূর্ণ, যা বার্ষিক প্রায় ১৬০ বিলিয়ন লেনদেন প্রক্রিয়া করে, যেখানে ডিসেম্বর ছুটির মতো ব্যস্ত সময়ে প্রতি সেকেন্ডে ৭০,০০০ লেনদেনের শীর্ষে পৌঁছে (VentureBeat)।
একই সাথে, স্পিচ রিকগনিশনেও অগ্রগতি দেখা যাচ্ছে। Mistral AI-এর Voxtral Realtime 4B মডেল বিভিন্ন রূপে প্রয়োগ করা হচ্ছে। এর একটি উদাহরণ হল Burn ML ফ্রেমওয়ার্ক ব্যবহার করে একটি খাঁটি Rust বাস্তবায়ন, যা Voxtral Mini 4B Realtime নামে পরিচিত, যা WASM এবং WebGPU-এর মাধ্যমে একটি ব্রাউজার ট্যাবে ক্লায়েন্ট-সাইডে চলতে পারে (Hacker News)। আরেকটি হল antirez দ্বারা তৈরি একই মডেলের জন্য ইনফারেন্স পাইপলাইনের একটি C বাস্তবায়ন, যার C স্ট্যান্ডার্ড লাইব্রেরির বাইরে কোনো বাহ্যিক নির্ভরতা নেই (Hacker News)। এই C বাস্তবায়ন একটি স্ট্রিমিং API অফার করে, যা ক্রমবর্ধমান অডিও ইনপুট এবং টোকেন স্ট্রিং আউটপুট করার অনুমতি দেয়।
Voxtral Mini 4B Realtime মডেল, যখন Q4 GGUF কোয়ান্টাইজড পাথ ব্যবহার করে, তখন মাত্র ২.৫ GB প্রয়োজন এবং অডিও ফাইল ট্রান্সক্রাইব করতে পারে। নেটিভ CLI মডেল ওজন (৯ GB) ডাউনলোড করতে পারে এবং অডিও ফাইল ট্রান্সক্রাইব করতে পারে। C বাস্তবায়ন stdin থেকে বা সরাসরি মাইক্রোফোন থেকে অডিও ইনপুট করার অনুমতি দেয়, যা ffmpeg-এর মাধ্যমে যেকোনো ফরম্যাট ট্রান্সকোড এবং ট্রান্সক্রাইব করা সহজ করে তোলে (Hacker News)।
এই উন্নয়নগুলি এআই-এর চলমান বিবর্তনকে তুলে ধরে, যার অ্যাপ্লিকেশনগুলি আর্থিক নিরাপত্তা থেকে শুরু করে অ্যাক্সেসযোগ্য স্পিচ রিকগনিশন পর্যন্ত বিস্তৃত। যেখানে মাস্টারকার্ডের ডিআই প্রো জালিয়াতির বিরুদ্ধে সুরক্ষার উপর দৃষ্টি নিবদ্ধ করে, সেখানে Voxtral-এর মতো প্রকল্পগুলি শক্তিশালী এআই সরঞ্জাম সরবরাহ করার জন্য ওপেন-সোর্স উদ্যোগের সম্ভাবনা প্রদর্শন করে।
সম্পর্কিত খবরে, স্বায়ত্তশাসিত এআই এজেন্টদের মধ্যে ফলাফল-চালিত সীমাবদ্ধতা লঙ্ঘনের মূল্যায়ন নিয়ে গবেষণা চলছে। এই এজেন্টদের নিরাপত্তা এবং মানুষের মূল্যবোধের সাথে সারিবদ্ধতা মূল্যায়নের জন্য একটি বেঞ্চমার্ক তৈরি করা হচ্ছে, যা উচ্চ-ঝুঁকিপূর্ণ পরিবেশে এআই সিস্টেম স্থাপন করার সময় একটি গুরুত্বপূর্ণ উদ্বেগের বিষয় (Hacker News)।
Discussion
AI Experts & Community
Be the first to comment