রিপোর্ট অনুযায়ী, OpenAI এবং প্রশিক্ষণ ডেটা সংস্থা হ্যান্ডশেক এআই তাদের তৃতীয় পক্ষের ঠিকাদারদের তাদের অতীত এবং বর্তমান ভূমিকাতে সম্পন্ন করা আসল কাজের উদাহরণ আপলোড করতে অনুরোধ করছে, যা বুদ্ধিবৃত্তিক সম্পত্তি এবং ডেটা গোপনীয়তা নিয়ে উদ্বেগ সৃষ্টি করেছে। ওয়্যার্ডের একটি প্রতিবেদন অনুসারে, এই উদ্যোগটি এআই সংস্থাগুলির মধ্যে উচ্চ-মানের প্রশিক্ষণ ডেটা তৈরি করার জন্য ঠিকাদারদের ব্যবহার করার একটি বৃহত্তর কৌশলের অংশ বলে মনে হচ্ছে, যার চূড়ান্ত লক্ষ্য হল আরও বেশি হোয়াইট-কলার কাজ স্বয়ংক্রিয় করা।
OpenAI-এর অনুরোধ, একটি কোম্পানির উপস্থাপনায় বর্ণিত, ঠিকাদারদের আগের চাকরিতে করা কাজগুলির বিশদ বিবরণ দিতে এবং তাদের কাজের সুনির্দিষ্ট উদাহরণ দিতে বলেছে, যার মধ্যে রয়েছে নথি, উপস্থাপনা, স্প্রেডশীট, ছবি এবং কোড সংগ্রহস্থল। সংস্থাটি ঠিকাদারদের এই ফাইলগুলি আপলোড করার আগে মালিকানাধীন এবং ব্যক্তিগতভাবে সনাক্তযোগ্য তথ্য (পিআইআই) সরিয়ে ফেলতে নির্দেশ দিয়েছে এবং এই প্রক্রিয়ায় সহায়তা করার জন্য একটি "চ্যাটজিপিটি সুপারস্টার স্ক্রাবিং টুল"-এর অ্যাক্সেস সরবরাহ করছে।
এই পদক্ষেপটি বৃহৎ ভাষা মডেল (এলএলএম) প্রশিক্ষণে ডেটার গুরুত্বপূর্ণ ভূমিকার উপর আলোকপাত করে। OpenAI-এর GPT সিরিজের মতো এই মডেলগুলি বিশাল ডেটাসেট বিশ্লেষণ করে মানুষের মানের টেক্সট তৈরি করতে শেখে। এই প্রশিক্ষণ ডেটার গুণমান এবং প্রাসঙ্গিকতা সরাসরি মডেলের কর্মক্ষমতা এবং ক্ষমতাকে প্রভাবিত করে। পেশাদার কাজের বাস্তব উদাহরণ ব্যবহার করে, এআই সংস্থাগুলি জটিল কাজগুলি স্বয়ংক্রিয় করতে তাদের মডেলগুলির নির্ভুলতা এবং কার্যকারিতা উন্নত করতে চায়।
তবে, এই অনুশীলনটি উল্লেখযোগ্য আইনি এবং নৈতিক প্রশ্ন উত্থাপন করে। বুদ্ধিবৃত্তিক সম্পত্তি আইনজীবী ইভান ব্রাউন ওয়্যার্ডকে বলেছেন যে এই পদ্ধতিটি এআই ল্যাবগুলির জন্য একটি বড় ঝুঁকি তৈরি করে, কারণ এটি গোপনীয় তথ্য কী তা সঠিকভাবে নির্ধারণ করার জন্য ঠিকাদারদের উপর অনেক বেশি নির্ভর করে। ব্রাউন বলেছেন, "যে কোনও এআই ল্যাব এই পদ্ধতি গ্রহণ করছে, তারা তাদের ঠিকাদারদের উপর অনেক বেশি আস্থা রাখার মাধ্যমে নিজেদেরকে বড় ঝুঁকিতে ফেলছে, যেখানে ঠিকাদাররাই সিদ্ধান্ত নেয় কোনটি গোপনীয় এবং কোনটি নয়।"
OpenAI-এর একজন মুখপাত্র নির্দিষ্ট উদ্যোগের বিষয়ে মন্তব্য করতে রাজি হননি।
ঠিকাদার-সরবরাহকৃত ডেটার ব্যবহার এআই শিল্পে একটি ক্রমবর্ধমান প্রবণতাকে প্রতিফলিত করে। এআই মডেলগুলি আরও অত্যাধুনিক হওয়ার সাথে সাথে উচ্চ-মানের, বাস্তব-বিশ্বের প্রশিক্ষণ ডেটার চাহিদা বাড়ছে। এই ডেটা পাওয়ার জন্য সংস্থাগুলি বিভিন্ন পদ্ধতি অন্বেষণ করছে, যার মধ্যে রয়েছে সিন্থেটিক ডেটা তৈরি, ওয়েব স্ক্র্যাপিং এবং ডেটা সরবরাহকারীদের সাথে অংশীদারিত্ব। তবে, ঠিকাদারদের উপর নির্ভরতা ডেটা সুরক্ষা, গোপনীয়তা এবং বুদ্ধিবৃত্তিক সম্পত্তির অধিকার সম্পর্কিত অনন্য চ্যালেঞ্জ তৈরি করে।
এই ডেটা সংগ্রহ কৌশলের দীর্ঘমেয়াদী প্রভাব এখনও উন্মোচিত হচ্ছে। যদি এটি সফল হয়, তবে এটি হোয়াইট-কলার চাকরির স্বয়ংক্রিয়করণকে ত্বরান্বিত করতে পারে, যা বিভিন্ন শিল্পে কর্মসংস্থানকে সম্ভাব্যভাবে প্রভাবিত করতে পারে। তদুপরি, বাস্তব-বিশ্বের ডেটার ব্যবহার এআই সিস্টেমে পক্ষপাতিত্ব এবং ন্যায্যতা সম্পর্কে উদ্বেগ বাড়ায়। যদি প্রশিক্ষণ ডেটা বিদ্যমান সামাজিক পক্ষপাতিত্বকে প্রতিফলিত করে, তবে এর ফলে এআই মডেলগুলি এই পক্ষপাতিত্বগুলিকে স্থায়ী এবং প্রসারিত করতে পারে।
OpenAI-এর ডেটা সংগ্রহ উদ্যোগের বর্তমান অবস্থা এখনও অস্পষ্ট। কতজন ঠিকাদার অংশগ্রহণ করেছেন বা কী পরিমাণ ডেটা সংগ্রহ করা হয়েছে তা জানা যায়নি। এআই সংস্থাগুলি যখন এই কৌশল অনুসরণ করতে থাকবে, তখন সম্ভবত নিয়ন্ত্রক তদারকি এবং জন বিতর্ক আরও তীব্র হবে, যেখানে বুদ্ধিবৃত্তিক সম্পত্তি এবং ব্যক্তিগত গোপনীয়তা রক্ষার জন্য সুস্পষ্ট নির্দেশিকা এবং সুরক্ষার প্রয়োজনীয়তার উপর দৃষ্টি নিবদ্ধ করা হবে।
Discussion
Join the conversation
Be the first to comment