أعلنت مؤسسة ويكيميديا، يوم الخميس، عن اتفاقيات ترخيص مع كل من مايكروسوفت، وميتا، وأمازون، وبيربلكسيتي، وميسترال للذكاء الاصطناعي، مما يضفي طابعًا رسميًا على نظام لشركات التكنولوجيا الكبرى لتعويض المؤسسة غير الربحية عن استخدام محتوى ويكيبيديا لتدريب نماذج الذكاء الاصطناعي الخاصة بها. تدعم هذه النماذج مساعدي الذكاء الاصطناعي مثل Microsoft Copilot وChatGPT الخاص بـ OpenAI.
تمثل هذه الصفقات تحولًا كبيرًا عن الممارسة السابقة المتمثلة في قيام هذه الشركات بكشط بيانات ويكيبيديا دون إذن صريح. ومع هذه الاتفاقيات، انضم معظم مطوري الذكاء الاصطناعي الرئيسيين الآن إلى برنامج ويكيميديا إنتربرايز، وهي شركة فرعية تجارية تقدم الوصول عبر واجهة برمجة التطبيقات (API) إلى قاعدة بيانات ويكيبيديا الواسعة التي تضم 65 مليون مقالة. يوفر هذا الوصول سرعات وأحجام بيانات أعلى مقارنة بواجهات برمجة التطبيقات المجانية والعامة. لم تكشف مؤسسة ويكيميديا عن الشروط المالية المحددة لهذه الشراكات الجديدة.
ينضم هؤلاء الشركاء الجدد إلى جوجل، التي أبرمت اتفاقية مماثلة مع ويكيميديا إنتربرايز في عام 2022، جنبًا إلى جنب مع كيانات أصغر مثل Ecosia وNomic وPleias وProRata وReef Media. تهدف الإيرادات المتأتية من اتفاقيات الترخيص هذه إلى المساعدة في تعويض تكاليف البنية التحتية الكبيرة المرتبطة بصيانة ويكيبيديا. تعتمد المؤسسة غير الربحية بشكل أساسي على التبرعات العامة الصغيرة بينما أصبح محتواها موردًا حاسمًا لتدريب نماذج الذكاء الاصطناعي.
يسلط استخدام محتوى ويكيبيديا في تدريب الذكاء الاصطناعي الضوء على العلاقة المعقدة بين المعرفة مفتوحة المصدر ومجال الذكاء الاصطناعي سريع التطور. تتطلب نماذج الذكاء الاصطناعي، وخاصة نماذج اللغة الكبيرة (LLMs)، مجموعات بيانات ضخمة للتعلم وإنشاء نصوص شبيهة بالنصوص البشرية. أصبحت ويكيبيديا، بمجموعتها الواسعة والمحررة بشكل تعاوني من المقالات، مصدرًا لا يقدر بثمن للمعلومات لهذه النماذج.
تثير اتفاقيات الترخيص أسئلة مهمة حول الآثار الأخلاقية والاقتصادية لاستخدام البيانات المتاحة للجمهور لتدريب أنظمة الذكاء الاصطناعي التجارية. في حين تستفيد ويكيبيديا من الإيرادات المتأتية من هذه الصفقات، إلا أن الآثار الأوسع لمستقبل المعرفة المفتوحة وتطوير الذكاء الاصطناعي لا تزال غير واضحة. تعكس خطوة مؤسسة ويكيميديا لتحقيق الدخل من الوصول إلى بياناتها اتجاهًا متزايدًا بين منشئي المحتوى الذين يسعون للحصول على تعويض عن استخدام أعمالهم في صناعة الذكاء الاصطناعي. يمكن أن تؤدي التطورات المستمرة في هذا المجال إلى إعادة تشكيل مشهد تدريب الذكاء الاصطناعي والوصول إلى البيانات في السنوات القادمة.
Discussion
Join the conversation
Be the first to comment