وفقًا لتقرير نشرته Wired، يُفيد بأن OpenAI وشركة Handshake AI المتخصصة في بيانات التدريب تطلبان من المتعاقدين الخارجيين تحميل أعمال حقيقية أُنجزت في وظائف سابقة وحالية. ويبدو أن هذه المبادرة جزء من استراتيجية أوسع بين شركات الذكاء الاصطناعي للاستفادة من المتعاقدين في توليد بيانات تدريب عالية الجودة، بهدف أتمتة المزيد من المهام المكتبية في نهاية المطاف.
وفقًا لتقرير Wired، يزعم أن عرضًا تقديميًا داخليًا لـ OpenAI يوجه المتعاقدين إلى تفصيل المهام التي أُنجزت في وظائف سابقة وتقديم أمثلة ملموسة للأعمال، مثل مستندات Word أو ملفات PDF أو عروض PowerPoint التقديمية أو جداول Excel أو الصور أو مستودعات التعليمات البرمجية. وتفيد التقارير بأن الشركة تنصح المتعاقدين بإزالة المعلومات السرية والبيانات الشخصية التعريفية قبل التحميل، وتقدم "أداة تنظيف ChatGPT Superstar" لهذا الغرض.
يثير هذا النهج مخاوف كبيرة بشأن الملكية الفكرية. صرح إيفان براون، محامي الملكية الفكرية، لـ Wired بأن أي مختبر للذكاء الاصطناعي يتبنى هذه الطريقة يواجه خطرًا كبيرًا، لأنه يعتمد بشكل كبير على جدارة المتعاقدين بالثقة. وينبع هذا القلق من احتمال قيام المتعاقدين بتحميل مواد محمية بحقوق الطبع والنشر أو مواد سرية عن غير قصد أو عمدًا، والتي يمكن بعد ذلك دمجها في نماذج الذكاء الاصطناعي.
تهدف البيانات التي يتم تحميلها بواسطة المتعاقدين إلى تدريب نماذج الذكاء الاصطناعي، وتمكينها من فهم عمليات العمل البشري وتقليدها بشكل أفضل. تتضمن هذه العملية تزويد النماذج بكميات هائلة من البيانات، مما يسمح لها بتحديد الأنماط والعلاقات داخل المعلومات. والهدف هو إنشاء أنظمة ذكاء اصطناعي قادرة على أداء مهام معقدة بأقل تدخل بشري.
يعتبر استخدام أمثلة من العالم الحقيقي أمرًا بالغ الأهمية لتطوير نماذج الذكاء الاصطناعي التي يمكنها أتمتة الوظائف المكتبية بدقة وفعالية. من خلال التدريب على عينات عمل أصلية، يمكن لأنظمة الذكاء الاصطناعي أن تتعلم التعامل مع الفروق الدقيقة وتعقيدات المهام المهنية المختلفة. ومع ذلك، تظل الآثار الأخلاقية والقانونية لاستخدام هذه البيانات موضع نقاش مستمر.
في الوقت الحالي، ليس من الواضح كيف تخطط OpenAI لاستخدام البيانات التي تم تحميلها وما هي الضمانات الموجودة لمنع إساءة الاستخدام أو انتهاك حقوق الطبع والنشر. لم تصدر الشركة بعد بيانًا رسميًا بشأن التقرير. يسلط هذا الوضع الضوء على التحديات والتعقيدات التي تنطوي عليها عملية الحصول على البيانات واستخدامها لتدريب الذكاء الاصطناعي، لا سيما عند التعامل مع معلومات حساسة أو مملوكة. من المرجح أن يراقب الخبراء القانونيون والمراقبون في الصناعة هذه التطورات عن كثب.
Discussion
Join the conversation
Be the first to comment