حقق باحثو Google اختراقًا يمكن أن يُحدث ثورة في الذكاء الاصطناعي. لقد طوروا "التعلم المعزز الداخلي" (internal RL)، وهي تقنية تسمح لنماذج الذكاء الاصطناعي بتعلم الاستدلال المعقد دون المخاطر النموذجية للهلوسة. يقدم هذا الابتكار، الذي تم الكشف عنه في 16 يناير 2026، مسارًا لإنشاء وكلاء ذكاء اصطناعي متقدمين.
يوجه التعلم المعزز الداخلي (Internal RL) الأعمال الداخلية للنموذج نحو حل المشكلات خطوة بخطوة. يتناقض هذا مع الطرق التقليدية التي تعتمد على التنبؤ بالكلمة التالية في التسلسل. يحد النهج الحالي من قدرة الذكاء الاصطناعي على التخطيط للمستقبل بفعالية. يعد التعلم المعزز أمرًا أساسيًا لتدريب نماذج اللغات الكبيرة (LLMs) بعد التدريب، خاصةً للمهام التي تتطلب تخطيطًا طويل الأجل.
يمكن رؤية التأثير المباشر في الأنظمة المستقلة. يعتقد الخبراء أن هذا يمكن أن يؤدي إلى وكلاء ذكاء اصطناعي قادرين على التعامل مع المهام المعقدة والروبوتات في العالم الحقيقي. يقلل هذا التقدم من الحاجة إلى الإشراف البشري المستمر.
تعاني نماذج اللغات الكبيرة (LLMs) الحالية من الاستدلال المعقد بسبب بنيتها. إنها تولد تسلسلات رمزًا تلو الآخر، مما يحد من قدرتها على استكشاف استراتيجيات جديدة. يتغلب التعلم المعزز الداخلي (Internal RL) على هذا القيد من خلال التركيز على الحالة الداخلية للنموذج.
تخطط Google لمواصلة تحسين التعلم المعزز الداخلي (Internal RL). تتضمن الخطوة التالية استكشاف إمكاناته في تطبيقات مختلفة. يمكن أن يفتح هذا إمكانيات جديدة للذكاء الاصطناعي في المجالات التي تتطلب اتخاذ قرارات معقدة.
Discussion
Join the conversation
Be the first to comment