تطلب OpenAI من المتعاقدين الخارجيين تحميل مهام وتكاليف حقيقية من وظائفهم الحالية أو السابقة لتقييم أداء نماذج الذكاء الاصطناعي من الجيل التالي. تكشف وثائق حصلت عليها WIRED من OpenAI وشركة بيانات التدريب Handshake AI عن هدف المشروع المتمثل في إنشاء خط أساس للأداء البشري لمختلف المهام، والذي سيستخدم بعد ذلك لتقييم قدرات نموذج الذكاء الاصطناعي.
تعد هذه المبادرة جزءًا من جهد OpenAI الأوسع، الذي أطلق في سبتمبر، لقياس نماذج الذكاء الاصطناعي الخاصة بها مقابل المهنيين البشريين في مختلف الصناعات. ترى الشركة هذه المقارنة كمقياس حاسم لتقييم التقدم المحرز نحو تحقيق الذكاء الاصطناعي العام (AGI)، والذي يُعرَّف بأنه نظام ذكاء اصطناعي يتفوق على القدرات البشرية في معظم المهام ذات القيمة الاقتصادية.
وفقًا لوثيقة سرية لـ OpenAI، "لقد وظفنا أشخاصًا من مختلف المهن للمساعدة في جمع المهام الواقعية التي تم تصميمها على غرار تلك التي قمت بها في وظائفك بدوام كامل، حتى نتمكن من قياس مدى جودة أداء نماذج الذكاء الاصطناعي في هذه المهام." وتوجه الوثيقة المتعاقدين إلى "أخذ أجزاء موجودة من العمل طويل الأجل أو المعقد (ساعات أو أيام) الذي قمت به في مهنتك وتحويل كل منها إلى مهمة."
تسلط استراتيجية جمع البيانات الضوء على تحدٍ رئيسي في تطوير الذكاء الاصطناعي: تقييم قدرة الذكاء الاصطناعي على أداء مهام العالم الحقيقي بدقة. من خلال مقارنة أداء الذكاء الاصطناعي بخط أساس بشري مشتق من العمل الفعلي، تهدف OpenAI إلى الحصول على فهم أكثر دقة لنقاط القوة والضعف في نماذجها. هذا النهج وثيق الصلة بشكل خاص حيث أصبحت أنظمة الذكاء الاصطناعي متكاملة بشكل متزايد في البيئات المهنية.
إن الآثار المترتبة على تحقيق AGI بعيدة المدى، ومن المحتمل أن تحدث تحولاً في الصناعات وتعيد تشكيل طبيعة العمل. في حين أن OpenAI تؤكد على الفوائد المحتملة لـ AGI، مثل زيادة الإنتاجية والابتكار، فإن التطوير يثير أيضًا مخاوف بشأن إزاحة الوظائف والاعتبارات الأخلاقية لأنظمة الذكاء الاصطناعي المستقلة بشكل متزايد.
تعكس عملية تقييم OpenAI الجدل الدائر داخل مجتمع الذكاء الاصطناعي حول أفضل طريقة لقياس أنظمة الذكاء الاصطناعي القوية بشكل متزايد والتحكم فيها. مع ازدياد تطور نماذج الذكاء الاصطناعي، يصبح إنشاء معايير موثوقة وبروتوكولات سلامة أمرًا ضروريًا لضمان تطويرها ونشرها بشكل مسؤول. لم تنشر الشركة تفاصيل محددة حول أنواع المهام التي يتم جمعها أو المعايير المستخدمة لتقييم أداء الذكاء الاصطناعي، لكنها ذكرت أن البيانات ستستخدم لتحسين دقة وموثوقية نماذج الذكاء الاصطناعي المستقبلية الخاصة بها. المشروع مستمر، ومن المتوقع أن تُعلم نتائج التقييم جهود التطوير المستقبلية في OpenAI.
Discussion
Join the conversation
Be the first to comment