الذكاء الاصطناعي يتسارع: تحويل الكلام إلى نص في الوقت الفعلي يصل إلى 300 مللي ثانية

نيويورك، نيويورك - التطورات الأخيرة في الذكاء الاصطناعي تحدث ضجة في مختلف القطاعات، من كشف الاحتيال إلى التعرف على الكلام. وفقًا لـ VentureBeat، يمكن لمنصة الاحتيال الرئيسية التابعة لشركة Mastercard، Decision Intelligence Pro (DI Pro)، الآن تحليل المعاملات الفردية وتحديد الأنشطة المشبوهة في أجزاء من الثانية. في الوقت نفسه، تظهر مشاريع مفتوحة المصدر تقدم قدرات التعرف على الكلام في الوقت الفعلي.

تم تصميم DI Pro من Mastercard لمكافحة التزايد المستمر للمعاملات الاحتيالية. تعالج شبكة الشركة ما يقرب من 160 مليار معاملة سنويًا، مع ذروات تصل إلى 70000 معاملة في الثانية خلال فترات الازدحام، كما ذكرت VentureBeat. أشار يوهان جيربر، ممثل شركة Mastercard، إلى أن المنصة تركز على تقييم المخاطر المرتبطة بكل معاملة.

في مجال التعرف على الكلام، تكتسب العديد من المشاريع زخمًا. أحد هذه المشاريع هو تطبيق Rust خالص لنموذج Voxtral Mini 4B Realtime من Mistral، متاح على GitHub (المصدر 3). يسمح هذا التطبيق، باستخدام إطار عمل Burn ML، بالتعرف على الكلام المتدفق بشكل أصلي وفي المتصفح. يمكن لمسار Q4 GGUF الكمي (2.5 جيجابايت) أن يعمل بالكامل من جانب العميل في علامة تبويب المتصفح عبر WASM و WebGPU. مشروع آخر، أيضًا على GitHub (المصدر 4)، يقدم تطبيق C خالص لخط أنابيب الاستدلال لنموذج Voxtral Realtime 4B من Mistral AI. هذا التطبيق ليس لديه تبعيات خارجية تتجاوز مكتبة C القياسية.

تأتي هذه التطورات في خضم مناقشات أوسع حول سلامة الذكاء الاصطناعي ومواءمته. تقدم ورقة بحثية مقدمة إلى arXiv (المصدر 2) معيارًا لتقييم انتهاكات القيود الموجهة بالنتائج في وكلاء الذكاء الاصطناعي المستقل. تركز الورقة على ضمان سلامة ومواءمة وكلاء الذكاء الاصطناعي في البيئات عالية المخاطر.

تسلط هذه التطورات الضوء على التطور السريع للذكاء الاصطناعي وتأثيره المحتمل على جوانب مختلفة من الحياة اليومية. من تأمين المعاملات المالية إلى تحسين إمكانية الوصول من خلال التعرف على الكلام، يواصل الذكاء الاصطناعي إعادة تشكيل الصناعات وخلق إمكانيات جديدة.