طور باحثون في جامعة ستانفورد وشركة Nvidia طريقة جديدة، تسمى التدريب الشامل في وقت الاختبار (TTT-E2E)، تسمح لنماذج الذكاء الاصطناعي بمواصلة التعلم بعد النشر دون زيادة تكاليف الاستدلال. يعالج هذا التطور التحدي المتزايد المتمثل في إدارة دقة السياق الطويل والكفاءة الحسابية في تطبيقات الذكاء الاصطناعي، خاصة بالنسبة للوكلاء المؤسسيين الذين يتعاملون مع المستندات والتذاكر والسجلات واسعة النطاق.
يعيد نهج TTT-E2E صياغة نمذجة اللغة كمشكلة تعلم مستمر. بدلاً من الاعتماد فقط على الحقائق المحفوظة من التدريب المسبق، تتكيف النماذج في الوقت الفعلي أثناء معالجة المعلومات الجديدة. يتيح ذلك للذكاء الاصطناعي الحفاظ على فهم محدث لبيئته وتحسين أدائه بمرور الوقت.
وفقًا للباحثين، يمكن لنموذج Transformer الناتج أن يطابق دقة السياق الطويل لنماذج الانتباه الكامل مع العمل بكفاءة قريبة من RNN. يمثل هذا تقدمًا كبيرًا لأعباء العمل المؤسسية حيث يمثل طول السياق والتكلفة الحسابية مصدر قلق كبير.
لطالما كان التوازن بين الدقة والكفاءة تحديًا للمطورين الذين يبنون أنظمة الذكاء الاصطناعي لمهام المستندات الطويلة. توفر محولات الانتباه الذاتي الكاملة دقة عالية ولكنها تتطلب موارد حسابية كبيرة. تقدم طريقة TTT-E2E حلاً محتملاً من خلال تمكين التعلم المستمر دون الزيادة الهائلة في التكلفة الحسابية المرتبطة عادةً بالسياقات الأطول.
تمتد آثار هذا البحث إلى ما وراء تطبيقات المؤسسات. من خلال تمكين نماذج الذكاء الاصطناعي من التعلم باستمرار والتكيف مع المعلومات الجديدة، يمكن لـ TTT-E2E تحسين أداء وموثوقية أنظمة الذكاء الاصطناعي في مجموعة واسعة من المجالات، من الرعاية الصحية إلى التمويل. يمكن أن يؤدي ذلك إلى تشخيصات أكثر دقة، وتنبؤات مالية أفضل، واتخاذ قرارات أكثر فعالية في مختلف المجالات.
تسلط الدراسة الضوء على إمكانات نماذج الذكاء الاصطناعي للتطور والتحسين بمرور الوقت، بدلاً من البقاء ثابتة بعد النشر. يمكن أن يؤدي ذلك إلى جيل جديد من أنظمة الذكاء الاصطناعي التي تكون أكثر قدرة على التكيف والمرونة والقدرة على التعامل مع تحديات العالم الحقيقي المعقدة. هناك حاجة إلى مزيد من البحث لاستكشاف الإمكانات الكاملة لـ TTT-E2E وتأثيرها على مستقبل الذكاء الاصطناعي.
Discussion
Join the conversation
Be the first to comment