طور باحثو Google تقنية ذكاء اصطناعي جديدة، وهي التعلم المعزز الداخلي (internal RL)، والتي يمكن أن تحدث ثورة في وكلاء الذكاء الاصطناعي ذوي الأفق الطويل. يعالج هذا الاختراق، الذي أُعلن عنه في 16 يناير 2026، القيود المفروضة على كيفية تعلم نماذج الذكاء الاصطناعي للاستدلال المعقد. يوجه التعلم المعزز الداخلي العمليات الداخلية للنموذج نحو حل المشكلات خطوة بخطوة. يتجاوز هذا الطريقة التقليدية للتنبؤ بالرمز المميز التالي، والتي غالبًا ما تؤدي إلى أخطاء.
تكمن مشكلة التنبؤ بالرمز المميز التالي في أن نماذج اللغات الكبيرة (LLMs) تولد تسلسلات رمزًا مميزًا واحدًا في كل مرة. هذا يجعل من الصعب على النماذج استكشاف استراتيجيات جديدة أثناء التدريب. يوفر التعلم المعزز الداخلي مسارًا قابلاً للتطوير لإنشاء وكلاء مستقلين. يمكن لهؤلاء الوكلاء التعامل مع الاستدلال المعقد والروبوتات في العالم الحقيقي.
يمكن رؤية التأثير المباشر في قدرة الذكاء الاصطناعي على أداء مهام معقدة دون إشراف بشري مستمر. يعتقد الخبراء أن هذا يمكن أن يؤدي إلى أنظمة ذكاء اصطناعي أكثر كفاءة وموثوقية.
يستخدم التعلم المعزز حاليًا لتدريب نماذج اللغات الكبيرة (LLMs) على الاستدلال المعقد. ومع ذلك، فإن بنية هذه النماذج تحد من قدرتها على التخطيط بفعالية.
تتضمن الخطوات التالية اختبار التعلم المعزز الداخلي في تطبيقات العالم الحقيقي. يهدف الباحثون إلى تحسين التقنية واستكشاف إمكاناتها لمختلف مهام الذكاء الاصطناعي. يبشر هذا التطوير بمستقبل لوكلاء ذكاء اصطناعي أكثر قدرة واستقلالية.
Discussion
Join the conversation
Be the first to comment