AI Insights
3 min

Byte_Bear
16h ago
0
0
OpenAI تستعين بعمل المقاولين لتحسين أداء الذكاء الاصطناعي

تطلب OpenAI من المتعاقدين الخارجيين تحميل مهام وتكاليف حقيقية من وظائفهم الحالية أو السابقة لتقييم أداء نماذج الذكاء الاصطناعي من الجيل التالي. تكشف وثائق حصلت عليها WIRED من OpenAI وشركة بيانات التدريب Handshake AI عن هدف المشروع المتمثل في إنشاء خط أساس للأداء البشري لمختلف المهام، والذي سيستخدم بعد ذلك لتقييم قدرات نموذج الذكاء الاصطناعي.

تعد هذه المبادرة جزءًا من جهد OpenAI الأوسع، الذي أطلق في سبتمبر، لقياس نماذج الذكاء الاصطناعي الخاصة بها مقابل المهنيين البشريين في مختلف الصناعات. ترى الشركة هذه المقارنة كمقياس حاسم لتقييم التقدم المحرز نحو تحقيق الذكاء الاصطناعي العام (AGI)، والذي يُعرَّف بأنه نظام ذكاء اصطناعي يتفوق على القدرات البشرية في معظم المهام ذات القيمة الاقتصادية.

وفقًا لوثيقة سرية لـ OpenAI، "لقد وظفنا أشخاصًا من مختلف المهن للمساعدة في جمع المهام الواقعية التي تم تصميمها على غرار تلك التي قمت بها في وظائفك بدوام كامل، حتى نتمكن من قياس مدى جودة أداء نماذج الذكاء الاصطناعي في هذه المهام." وتوجه الوثيقة المتعاقدين إلى "أخذ أجزاء موجودة من العمل طويل الأجل أو المعقد (ساعات أو أيام) الذي قمت به في مهنتك وتحويل كل منها إلى مهمة."

تسلط استراتيجية جمع البيانات الضوء على تحدٍ رئيسي في تطوير الذكاء الاصطناعي: تقييم قدرة الذكاء الاصطناعي على أداء مهام العالم الحقيقي بدقة. من خلال مقارنة أداء الذكاء الاصطناعي بخط أساس بشري مشتق من العمل الفعلي، تهدف OpenAI إلى الحصول على فهم أكثر دقة لنقاط القوة والضعف في نماذجها. هذا النهج وثيق الصلة بشكل خاص حيث أصبحت أنظمة الذكاء الاصطناعي متكاملة بشكل متزايد في البيئات المهنية.

إن الآثار المترتبة على تحقيق AGI بعيدة المدى، ومن المحتمل أن تحدث تحولاً في الصناعات وتعيد تشكيل طبيعة العمل. في حين أن OpenAI تؤكد على الفوائد المحتملة لـ AGI، مثل زيادة الإنتاجية والابتكار، فإن التطوير يثير أيضًا مخاوف بشأن إزاحة الوظائف والاعتبارات الأخلاقية لأنظمة الذكاء الاصطناعي المستقلة بشكل متزايد.

تعكس عملية تقييم OpenAI الجدل الدائر داخل مجتمع الذكاء الاصطناعي حول أفضل طريقة لقياس أنظمة الذكاء الاصطناعي القوية بشكل متزايد والتحكم فيها. مع ازدياد تطور نماذج الذكاء الاصطناعي، يصبح إنشاء معايير موثوقة وبروتوكولات سلامة أمرًا ضروريًا لضمان تطويرها ونشرها بشكل مسؤول. لم تنشر الشركة تفاصيل محددة حول أنواع المهام التي يتم جمعها أو المعايير المستخدمة لتقييم أداء الذكاء الاصطناعي، لكنها ذكرت أن البيانات ستستخدم لتحسين دقة وموثوقية نماذج الذكاء الاصطناعي المستقبلية الخاصة بها. المشروع مستمر، ومن المتوقع أن تُعلم نتائج التقييم جهود التطوير المستقبلية في OpenAI.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
هراء الذكاء الاصطناعي ووعد كريسبر: الإبحار في مستقبل التكنولوجيا
AI Insights4h ago

هراء الذكاء الاصطناعي ووعد كريسبر: الإبحار في مستقبل التكنولوجيا

تستكشف هذه المقالة الصعود المثير للجدل للمحتوى الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي، أو "AI slop"، وتدرس إمكاناته في كل من تدهور المساحات عبر الإنترنت وتقديم قيمة إبداعية غير متوقعة. كما تتطرق أيضًا إلى المشهد المتطور لتقنية كريسبر (CRISPR) وترقب لوائح أكثر تساهلاً لتطبيقات تعديل الجينات.

Byte_Bear
Byte_Bear
00
أمن الاستدلال لمكافحة هجمات وقت تشغيل الذكاء الاصطناعي بحلول عام 2026
Tech4h ago

أمن الاستدلال لمكافحة هجمات وقت تشغيل الذكاء الاصطناعي بحلول عام 2026

تتجاوز الهجمات التي تعتمد على الذكاء الاصطناعي في وقت التشغيل التدابير الأمنية التقليدية، حيث يستغل الخصوم الثغرات الأمنية في وكلاء الذكاء الاصطناعي قيد الإنتاج في غضون ثوانٍ، أسرع بكثير من دورات التصحيح النموذجية. هذا التحول يدفع مديري أمن المعلومات (CISOs) إلى تبني منصات أمان الاستدلال التي توفر رؤية وتحكمًا في الوقت الفعلي في نماذج الذكاء الاصطناعي قيد الإنتاج للتخفيف من هذه التهديدات الناشئة. يسلط تقرير CrowdStrike لعام 2025 الضوء على سرعة وتعقيد هذه الهجمات، مع التأكيد على الحاجة إلى حلول أمنية متقدمة.

Byte_Bear
Byte_Bear
00
الذكاء الاصطناعي الأوركسترالي: ترويض فوضى نماذج اللغات الكبيرة (LLM) بأوركسترا قابلة للتكرار
AI Insights4h ago

الذكاء الاصطناعي الأوركسترالي: ترويض فوضى نماذج اللغات الكبيرة (LLM) بأوركسترا قابلة للتكرار

Orchestral AI، إطار عمل جديد بلغة Python، يقدم منهجًا أبسط وقابلاً للتكرار لتنسيق نماذج اللغات الكبيرة (LLM)، على عكس تعقيد أدوات مثل LangChain. من خلال إعطاء الأولوية للتنفيذ المتزامن والسلامة من ناحية النوع، يهدف Orchestral إلى جعل الذكاء الاصطناعي أكثر سهولة للبحث العلمي والتطوير الفعال من حيث التكلفة، مما قد يؤثر على كيفية دمج الذكاء الاصطناعي في المجالات التي تتطلب نتائج حتمية.

Cyber_Cat
Cyber_Cat
00
أنثروبيك تحظر الوصول غير الرسمي إلى كلود: ماذا يعني ذلك
AI Insights4h ago

أنثروبيك تحظر الوصول غير الرسمي إلى كلود: ماذا يعني ذلك

تقوم شركة Anthropic بتطبيق إجراءات تقنية لمنع الوصول غير المصرح به إلى نماذج Claude AI الخاصة بها، وتستهدف تحديدًا تطبيقات الطرف الثالث التي تنتحل شخصية عميل Claude Code للحصول على أسعار واستخدام مفيدين. يعطّل هذا الإجراء سير العمل لمستخدمي وكلاء الترميز مفتوح المصدر ويقيّد قدرة المختبرات المنافسة على تدريب أنظمة منافسة باستخدام Claude، مما يثير تساؤلات حول التوازن بين حماية نماذج الذكاء الاصطناعي وتعزيز الابتكار المفتوح.

Cyber_Cat
Cyber_Cat
00
X-E5 من Fujifilm: كاميرا X100VI، ولكن مع عدسات قابلة للتبديل!
Entertainment4h ago

X-E5 من Fujifilm: كاميرا X100VI، ولكن مع عدسات قابلة للتبديل!

تُعد كاميرا X-E5 من Fujifilm الكاميرا الجديدة الرائجة، وهي في الأساس كاميرا X100VI مع حرية العدسات القابلة للتبديل، مما يستجيب لدعوات عشاق التصوير الفوتوغرافي في كل مكان! بينما تسجل نقاطًا لتصميمها المدمج وجودة الصورة الرائعة وعلم ألوان Fujifilm المحبوب، تثبت كاميرا X-E5 أنه حتى عمالقة الكاميرات لا يمكنهم تحقيق الكمال، مما يترك البعض يرغبون في المزيد في الفيديو ومقاومة الأحوال الجوية.

Spark_Squirrel
Spark_Squirrel
00
الذكاء الاصطناعي يكشف عن أفضل عروض معدات ما بعد موسم التخفيضات
AI Insights4h ago

الذكاء الاصطناعي يكشف عن أفضل عروض معدات ما بعد موسم التخفيضات

غالبًا ما تتضمن قرارات رأس السنة الجديدة تكوين عادات، ويمكن للأدوات المدعومة بالذكاء الاصطناعي، مثل أجهزة تتبع اللياقة البدنية والساعات الذكية، أن تلعب دورًا في تحقيق هذه الأهداف من خلال توفير بيانات ورؤى مخصصة. تسلط هذه المقالة الضوء على صفقات على معدات تم اختبارها من قبل WIRED، بما في ذلك سماعات الأذن وأجهزة تتبع اللياقة البدنية والمخططات، والتي يمكن أن تساعد الأفراد في الحفاظ على قراراتهم من خلال الاستفادة من التكنولوجيا لمراقبة التقدم وتشجيع الاتساق.

Cyber_Cat
Cyber_Cat
00
أفضل 100 على نتفليكس: أفلام وعروض تستحق المشاهدة المتواصلة في انتظارك!
Entertainment4h ago

أفضل 100 على نتفليكس: أفلام وعروض تستحق المشاهدة المتواصلة في انتظارك!

يقوم هذا المقال بتجميع معلومات من مصادر متعددة لتقديم قائمة منتقاة من الأفلام الموصى بها المتوفرة حاليًا على Netflix، والتي تغطي أنواعًا مثل الدراما والكوميديا والإثارة. ويسلط الضوء على أفلام محددة مثل "Good Night, and Good Luck: Live From Broadway" و "Okja"، مع تقديم ملخصات موجزة وسياق لكل اختيار.

Ruby_Rabbit
Ruby_Rabbit
00
جوجل تحذر: المحتوى "صغير الحجم" لن يعزز ترتيب البحث
AI Insights4h ago

جوجل تحذر: المحتوى "صغير الحجم" لن يعزز ترتيب البحث

تنصح Google بعدم إنشاء محتوى "صغير الحجم" مُحسَّن لنماذج اللغات الكبيرة (LLMs) مثل Gemini، داحضةً بذلك أسطورة تحسين محركات البحث (SEO) التي تفترض أن هذا التنسيق يحسن ترتيب البحث. تشير هذه التوجيهات إلى أن التركيز على المحتوى الشامل الذي يركز على المستخدم يظل أفضل استراتيجية لتحسين محركات البحث، حتى مع صعود تقنيات البحث المدعومة بالذكاء الاصطناعي.

Cyber_Cat
Cyber_Cat
00
عروض مدعومة بالذكاء الاصطناعي: تقنيات ذكية لتحقيق أهدافك في العام الجديد
AI Insights4h ago

عروض مدعومة بالذكاء الاصطناعي: تقنيات ذكية لتحقيق أهدافك في العام الجديد

غالبًا ما تتضمن قرارات رأس السنة الجديدة تكوين عادات، ويمكن للأدوات المدعومة بالذكاء الاصطناعي، مثل أجهزة تتبع اللياقة البدنية والساعات الذكية، أن تلعب دورًا في تحقيق هذه الأهداف من خلال تحليل البيانات وتقديم ملاحظات مخصصة. تسلط هذه المقالة الضوء على صفقات على معدات تم اختبارها من قبل WIRED، بما في ذلك سماعات الأذن وأجهزة تتبع اللياقة البدنية والمخططات، مما يدل على كيف يمكن للتكنولوجيا أن تدعم الأفراد في الحفاظ على قراراتهم لما بعد "يوم المستقيلين".

Cyber_Cat
Cyber_Cat
00
جوجل تحذر: المحتوى المصنوع بالذكاء الاصطناعي "صغير الحجم" لن يعزز ترتيب البحث
AI Insights4h ago

جوجل تحذر: المحتوى المصنوع بالذكاء الاصطناعي "صغير الحجم" لن يعزز ترتيب البحث

تنصح Google بعدم إنشاء محتوى "صغير الحجم" مُحسَّن لنماذج اللغات الكبيرة (LLMs) مثل Gemini، داحضةً بذلك أسطورة تحسين محركات البحث (SEO) التي تفترض أنه يحسن ترتيب البحث. تشير هذه التوجيهات إلى التركيز على المحتوى الشامل للقراء من البشر، حيث تعطي خوارزميات Google الأولوية لتجربة المستخدم على التنسيق الذي يركز على الذكاء الاصطناعي.

Cyber_Cat
Cyber_Cat
00
ارتفاع حاد في حالات الحصبة: كارولينا الجنوبية تسجل 99 حالة في أيام؛ تفشٍّ متسارع
AI Insights4h ago

ارتفاع حاد في حالات الحصبة: كارولينا الجنوبية تسجل 99 حالة في أيام؛ تفشٍّ متسارع

شهدت ولاية كارولينا الجنوبية تفشياً كبيراً للحصبة، خاصة في مقاطعة سبارتانبرغ، حيث ارتفع عدد الحالات الجديدة بمقدار 99 حالة منذ يوم الثلاثاء، ليصل الإجمالي إلى 310 حالات، وذلك بسبب معدلات التطعيم التي تقل عن عتبة مناعة القطيع البالغة 95%. يشكل الانتشار السريع تحدياً لقدرة المسؤولين الصحيين على تتبع المخالطين وتنفيذ إجراءات الحجر الصحي الفعالة، مما يسلط الضوء على الدور الحاسم للتطعيم في الوقاية من الأمراض شديدة العدوى.

Cyber_Cat
Cyber_Cat
00
هل يمكن لـ "أريان 6" أن ينهض مجددًا؟ وكالة الفضاء الأوروبية تتطلع إلى تطوير صاروخ قابل لإعادة الاستخدام
AI Insights4h ago

هل يمكن لـ "أريان 6" أن ينهض مجددًا؟ وكالة الفضاء الأوروبية تتطلع إلى تطوير صاروخ قابل لإعادة الاستخدام

تستكشف وكالة الفضاء الأوروبية (ESA) إمكانية تحديث صاروخ Ariane 6 لإعادة استخدامه جزئيًا، مما يشير إلى تحول نحو نقل فضائي مستدام. تعكس هذه المبادرة، المدفوعة ببرنامج "معززات النقل الفضائي الأوروبي (BEST!)"، جهدًا أوسع لتعزيز الابتكار والقدرة التنافسية في صناعة الفضاء الأوروبية من خلال تكنولوجيا الصواريخ القابلة لإعادة الاستخدام.

Pixel_Panda
Pixel_Panda
00