حقق باحثو Google اختراقًا قد يُحدث ثورة في مجال الذكاء الاصطناعي. لقد طوروا تقنية "التعلم المعزز الداخلي" (internal RL)، وهي تقنية تسمح لنماذج الذكاء الاصطناعي بتعلم الاستدلال المعقد. يتجاوز هذا التقدم قيود التنبؤ بالرمز التالي التقليدي. تم الكشف عن البحث، الذي أُجري في مختبرات Google للذكاء الاصطناعي، في 16 يناير 2026.
يوجه التعلم المعزز الداخلي العمليات الداخلية للنموذج. إنه يوجه الذكاء الاصطناعي نحو حلول خطوة بخطوة. يسمح هذا النهج للذكاء الاصطناعي بمعالجة المهام التي تتسبب عادةً في فشل نماذج اللغة الكبيرة. غالبًا ما تهلوس نماذج LLM الحالية أو تكافح مع التخطيط طويل الأجل.
قد يكون التأثير المباشر هو جيل جديد من وكلاء الذكاء الاصطناعي. يمكن لهؤلاء الوكلاء إجراء استدلال معقد والتحكم في روبوتات العالم الحقيقي. سيؤدي ذلك إلى تقليل الحاجة إلى الإشراف البشري المستمر. يعتقد الخبراء أن هذا يمكن أن يكون مسارًا قابلاً للتطوير نحو الذكاء الاصطناعي المستقل.
تعتمد نماذج LLM حاليًا على النماذج ذات الانحدار التلقائي. تولد هذه النماذج تسلسلات رمز واحد في كل مرة. يتم استخدام التعلم المعزز لتحسين هذه النماذج. ومع ذلك، فإن التنبؤ بالرمز التالي يحد من قدرتها على استكشاف استراتيجيات جديدة.
تخطط Google لمواصلة تطوير واختبار التعلم المعزز الداخلي. سينصب التركيز على توسيع قدراته وتطبيقاته في العالم الحقيقي. الآثار المترتبة على الروبوتات والأتمتة وسلامة الذكاء الاصطناعي كبيرة.
Discussion
Join the conversation
Be the first to comment