OpenAI বেশ কয়েকটি টিমকে পুনর্গঠন করছে অডিও-ভিত্তিক এআই হার্ডওয়্যার পণ্য উন্নয়নের দিকে মনোযোগ দেওয়ার জন্য। The Information-এর একটি প্রতিবেদন অনুযায়ী, এটি ভয়েস-চালিত ইন্টারফেসের দিকে একটি কৌশলগত পরিবর্তনের ইঙ্গিত দেয়। ChatGPT মডেলের জন্য পরিচিত এই কোম্পানিটি ২০২৬ সালের প্রথম ত্রৈমাসিকে একটি নতুন অডিও ভাষা মডেল প্রকাশ করার পরিকল্পনা করছে, যা এই হার্ডওয়্যার উদ্যোগের দিকে একটি পদক্ষেপ।
এই পুনর্গঠনে প্রকৌশল, পণ্য এবং গবেষণা দলগুলোকে একত্রিত করে অডিও মডেলগুলোকে উন্নত করার একটি সমন্বিত প্রচেষ্টা চালানো হবে। The Information কর্তৃক উদ্ধৃত বর্তমান এবং প্রাক্তন কর্মচারীসহ পরিকল্পনার সাথে পরিচিত সূত্রগুলো জানায়, OpenAI-এর গবেষকরা মনে করেন তাদের অডিও মডেলগুলো বর্তমানে নির্ভুলতা এবং গতির দিক থেকে টেক্সট-ভিত্তিক মডেলগুলোর চেয়ে পিছিয়ে আছে। এই বৈষম্য ব্যবহারকারীর আচরণে প্রতিফলিত হয়, যেখানে তুলনামূলকভাবে খুব কম ChatGPT ব্যবহারকারী টেক্সটের চেয়ে ভয়েস ইন্টারফেস বেছে নেন।
অডিও মডেলগুলোর উন্নতির এই পদক্ষেপের কারণ হলো অটোমোবাইলের মতো ডিভাইসগুলোতে এআই প্রযুক্তির ব্যবহার আরও বিস্তৃত করার সম্ভাবনা। আরও অত্যাধুনিক এবং ব্যবহারকারী-বান্ধব ভয়েস ইন্টারফেস তৈরি করে OpenAI ব্যবহারকারীদের পছন্দ ভয়েস ইন্টারঅ্যাকশনের দিকে সরিয়ে নিতে চায়।
অডিও-ভিত্তিক এআই হার্ডওয়্যার তৈরি সমাজের জন্য বেশ কিছু প্রভাব ফেলতে পারে। উন্নত ভয়েস ইন্টারফেস প্রতিবন্ধী ব্যবহারকারীদের জন্য সুবিধা বাড়াতে পারে, যা প্রযুক্তির সাথে সহজে যোগাযোগ করতে সাহায্য করবে। তাছাড়া, গাড়ির মতো ডিভাইসগুলোতে এআইয়ের সংমিশ্রণ আরও স্বজ্ঞাত এবং নিরাপদ ব্যবহারকারীর অভিজ্ঞতা দিতে পারে। তবে, ভয়েস-অ্যাক্টিভেটেড প্রযুক্তির উপর ক্রমবর্ধমান নির্ভরতা ডেটা গোপনীয়তা এবং নিরাপত্তা নিয়ে উদ্বেগ বাড়ায়, সেইসাথে ভয়েস ডেটার অপব্যবহারের সম্ভাবনাও থাকে।
OpenAI-এর অডিও মডেলের উপর মনোযোগ এআই ইন্ডাস্ট্রিতে মাল্টিমোডাল এআইয়ের দিকে একটি বৃহত্তর প্রবণতাকে প্রতিফলিত করে, যা আরও ব্যাপক এবং বহুমুখী এআই সিস্টেম তৈরি করতে টেক্সট, অডিও এবং চিত্রের মতো বিভিন্ন ধরণের ডেটাকে একত্রিত করে। এই ক্ষেত্রে সাম্প্রতিক উন্নয়নের মধ্যে রয়েছে স্পিচ রিকগনিশন, ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং এবং অডিও জেনারেশনের অগ্রগতি, যা আরও বাস্তবসম্মত এবং ইন্টারেক্টিভ এআই অভিজ্ঞতা সক্ষম করে।
কোম্পানিটি পুনর্গঠন নিশ্চিত করে কোনো আনুষ্ঠানিক বিবৃতি প্রকাশ করেনি। নতুন অডিও ভাষা মডেলের ২০২৬ সালের প্রত্যাশিত রিলিজের বাইরে অডিও-ভিত্তিক হার্ডওয়্যারের উন্নয়নের সময়সীমা এখনও অস্পষ্ট।
Discussion
Join the conversation
Be the first to comment