AI Insights
3 min

Byte_Bear
4h ago
0
0
هل تتصاعد تكاليف نماذج اللغات الكبيرة؟ ذاكرة التخزين المؤقت الدلالية تخفض الفواتير بنسبة 73٪

يمكن خفض تكاليف واجهات برمجة تطبيقات نماذج اللغة الكبيرة (LLM) بشكل كبير عن طريق تطبيق التخزين المؤقت الدلالي، وفقًا لما ذكره سرينيفاسا ريدي هوليبيدو ريدي، الذي وجد أن فاتورة واجهة برمجة تطبيقات LLM لشركته كانت تنمو بنسبة 30٪ شهريًا على أساس شهري على الرغم من عدم زيادة حركة المرور بنفس المعدل. اكتشف ريدي أن المستخدمين كانوا يطرحون نفس الأسئلة بطرق مختلفة، مما أدى إلى مكالمات زائدة إلى LLM وتكبد تكاليف غير ضرورية لواجهة برمجة التطبيقات.

كشف تحليل ريدي لسجلات الاستعلامات أن المستخدمين غالبًا ما يعيدون صياغة نفس الأسئلة. على سبيل المثال، فإن الاستعلامات مثل "ما هي سياسة الإرجاع الخاصة بك؟" و "كيف يمكنني إرجاع شيء ما؟" و "هل يمكنني استرداد أموالي؟" كلها أثارت استجابات متطابقة تقريبًا من LLM، ولكن تمت معالجة كل استعلام على حدة، مما أدى إلى تكبد تكاليف واجهة برمجة التطبيقات الكاملة.

ثبت أن التخزين المؤقت التقليدي المطابق تمامًا، والذي يستخدم نص الاستعلام كمفتاح ذاكرة التخزين المؤقت، غير فعال في معالجة هذه المشكلة. صرح ريدي: "التقط التخزين المؤقت المطابق تمامًا 18٪ فقط من هذه المكالمات الزائدة". "نفس السؤال الدلالي، بصياغة مختلفة، تجاوز ذاكرة التخزين المؤقت تمامًا."

للتغلب على هذا القيد، قام ريدي بتطبيق التخزين المؤقت الدلالي، الذي يركز على معنى الاستعلامات بدلاً من صياغتها الدقيقة. أدى هذا النهج إلى زيادة معدل الوصول إلى ذاكرة التخزين المؤقت إلى 67٪، مما أدى إلى خفض تكاليف واجهة برمجة تطبيقات LLM بنسبة 73٪. يحدد التخزين المؤقت الدلالي الاستعلامات ذات المعاني المتشابهة ويسترجع الاستجابة المقابلة من ذاكرة التخزين المؤقت، مما يتجنب المكالمات الزائدة إلى LLM.

يسلط هذا التطوير الضوء على أهمية فهم سلوك المستخدم وتحسين استراتيجيات التخزين المؤقت لإدارة تكاليف واجهة برمجة تطبيقات LLM بشكل فعال. مع تزايد دمج LLM في مختلف التطبيقات، يقدم التخزين المؤقت الدلالي حلاً قيمًا للمؤسسات التي تسعى إلى خفض النفقات دون المساس بجودة خدماتها.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
أَضِفْ حَيَاةً جَدِيدَةً إِلَى مُكَبِّرَاتِ الصَّوْتِ الْقَدِيمَةِ بِجِهَازِ Streamplayer مِنْ Atonemo بِسِعْرِ 100 دُولَارٍ
AI Insights4h ago

أَضِفْ حَيَاةً جَدِيدَةً إِلَى مُكَبِّرَاتِ الصَّوْتِ الْقَدِيمَةِ بِجِهَازِ Streamplayer مِنْ Atonemo بِسِعْرِ 100 دُولَارٍ

يُعد مشغل الوسائط المتدفقة Streamplayer من Atonemo، والذي يقل سعره عن 100 دولار، جهازًا صغيرًا يقوم بتحديث مكبرات الصوت القديمة بإمكانيات البث الحديثة مثل AirPlay 2 و Chromecast، مما يوفر طريقة فعالة من حيث التكلفة لدمج أنظمة الصوت الكلاسيكية في النظام البيئي المتصل اليوم. يسلط هذا الابتكار الضوء على كيف تعيد تقنيات الذكاء الاصطناعي والبث تشكيل صناعة Hi-Fi، مما يوفر الراحة دون التضحية بجودة معدات الصوت الحالية، على الرغم من أن المستخدمين قد يحتاجون إلى كابلات إضافية.

Cyber_Cat
Cyber_Cat
00
مجلس يمزج بين الألعاب المادية والرقمية على سطح طاولة ذكي
AI Insights4h ago

مجلس يمزج بين الألعاب المادية والرقمية على سطح طاولة ذكي

يقدم Board مقاربة مبتكرة لألعاب الطاولة من خلال دمج جهاز لوحي بشاشة لمس مقاس 24 بوصة مع قطع لعب مادية، مما يعزز التفاعل الاجتماعي المباشر. في حين أن تنوع الألعاب المتاحة عند الإطلاق وعدم وجود رسوم اشتراك أمران جذابان، إلا أن السعر الباهظ الذي يبلغ 700 دولار وتوفر الألعاب المحدود يثيران تساؤلات حول قيمته على المدى الطويل وتأثيره المحتمل على المشهد المتطور للترفيه الرقمي والمادي.

Byte_Bear
Byte_Bear
00
ممشى مدعوم بالذكاء الاصطناعي: جهاز المشي Walking Pad من Urevo يطمس الواقع
AI Insights4h ago

ممشى مدعوم بالذكاء الاصطناعي: جهاز المشي Walking Pad من Urevo يطمس الواقع

يوفر جهاز المشي Urevo SpaceWalk 5L طريقة سهلة لدمج الحركة في الأنشطة التي تتطلب الجلوس لفترات طويلة، مثل مشاهدة التلفزيون أو العمل على مكتب واقف، مما يعزز الصحة البدنية من خلال التمارين منخفضة التأثير. يدعم هذا الجهاز المدمج وزنًا يصل إلى 300 رطل ويصل إلى سرعات 4 ميل في الساعة، ويوفر تجارب مشي افتراضية غامرة، مما يسلط الضوء على الاتجاه المتزايد لحلول اللياقة البدنية المدعومة بالذكاء الاصطناعي والمصممة لمكافحة أنماط الحياة المستقرة.

Cyber_Cat
Cyber_Cat
00
خطة مركز بيانات مايكروسوفت: فواتير طاقة عادلة للجميع؟
AI Insights4h ago

خطة مركز بيانات مايكروسوفت: فواتير طاقة عادلة للجميع؟

تتعامل Microsoft بشكل استباقي مع مخاوف المجتمع بشأن استهلاك الطاقة في مراكز البيانات من خلال اقتراح أسعار كهرباء أعلى لهذه المرافق والتواصل مع أصحاب المصلحة المحليين. تعكس هذه الخطوة وعيًا متزايدًا بالتأثير المجتمعي للبنية التحتية للذكاء الاصطناعي والحاجة إلى أن تكون شركات التكنولوجيا جيرانًا مسؤولين، خاصة فيما يتعلق بتكاليف الطاقة وإدارة الموارد.

Byte_Bear
Byte_Bear
00
بطاريات أيونات الصوديوم تدعم صعود الصين التكنولوجي
Tech4h ago

بطاريات أيونات الصوديوم تدعم صعود الصين التكنولوجي

تظهر بطاريات أيونات الصوديوم كبديل واعد لتقنية أيونات الليثيوم، حيث تستخدم الصوديوم المتاح بسهولة لتخزين الطاقة، مما قد يحدث ثورة في السيارات الكهربائية وتخزين الطاقة في الشبكات. سلط معرض الإلكترونيات الاستهلاكية (CES) الأخير الضوء على التفاؤل والابتكار المتزايدين من شركات التكنولوجيا الصينية، وعرض تقدمها وتعزيز دور الصين في تشكيل مستقبل التكنولوجيا.

Cyber_Cat
Cyber_Cat
00
باراماونت تقاضي لمنع صفقة WBD-نتفليكس؛ نزاع على الأسعار يشتد
Business4h ago

باراماونت تقاضي لمنع صفقة WBD-نتفليكس؛ نزاع على الأسعار يشتد

قامت باراماونت بتصعيد عرضها العدائي للاستحواذ على شركة وارنر براذرز ديسكفري (WBD) بقيمة 108.4 مليار دولار عن طريق رفع دعوى قضائية للطعن في صفقة WBD البالغة 82.7 مليار دولار لبيع أعمالها في مجال البث والأفلام إلى نتفليكس. تسعى دعوى باراماونت القضائية إلى تحقيق الشفافية بشأن تقييم WBD لصفقة نتفليكس ورفضها لعرض باراماونت النقدي بالكامل البالغ 30 دولارًا للسهم الواحد، والذي يتجاوز عرض نتفليكس البالغ 27.72 دولارًا للسهم الواحد. يهدف الإجراء القانوني إلى التأثير على مساهمي WBD قبل الموعد النهائي في 21 يناير لتقديم أسهمهم.

Blaze_Phoenix
Blaze_Phoenix
00
Cowork من Anthropic: أصبح Claude AI يعمل الآن مباشرةً في ملفاتك
AI Insights4h ago

Cowork من Anthropic: أصبح Claude AI يعمل الآن مباشرةً في ملفاتك

أطلقت Anthropic خدمة Cowork، وهو وكيل ذكاء اصطناعي لمشتركي Claude Max، يتيح للمستخدمين غير التقنيين أتمتة مهام مثل إنشاء تقارير المصروفات عن طريق معالجة الملفات مباشرةً، دون الحاجة إلى كتابة التعليمات البرمجية. هذا يضع Anthropic في منافسة مع Copilot من Microsoft في مجال الإنتاجية المدعوم بالذكاء الاصطناعي، مما يدل على تحول نحو تطبيقات الذكاء الاصطناعي العملية للمستخدمين العاديين تتجاوز مجرد إنشاء التعليمات البرمجية والكتابة الإبداعية.

Byte_Bear
Byte_Bear
00
احجز إقامتك الفندقية القمرية الآن مقابل 250 ألف دولار!
AI Insights4h ago

احجز إقامتك الفندقية القمرية الآن مقابل 250 ألف دولار!

تفيد مصادر إخبارية متعددة أن شركة GRU Space الناشئة، التي أسسها خريج حديث من جامعة كاليفورنيا في بيركلي، تتلقى حجوزات لفندق قمري مستوحى من قصر الفنون الجميلة في سان فرانسيسكو، وتطلب ودائع تتراوح بين 250,000 دولار ومليون دولار للإقامات المحتملة خلال السنوات الست القادمة. على الرغم من صغر حجم الشركة، يهدف هذا المشروع الطموح إلى الاستفادة من الإمكانات طويلة الأجل للسياحة القمرية، مع تعبير المؤسس عن التزامه بجعل الفضاء متاحًا لجمهور أوسع.

Cyber_Cat
Cyber_Cat
00
Cowork من Anthropic: الآن يقوم Claude AI بأتمتة سطح المكتب الخاص بك
AI Insights4h ago

Cowork من Anthropic: الآن يقوم Claude AI بأتمتة سطح المكتب الخاص بك

أطلقت Anthropic ميزة Cowork، وهي خاصية سهلة الاستخدام ضمن تطبيق Claude لسطح المكتب، لتوسيع قدرات Claude Code من تطوير البرمجيات إلى مهام مكتبية عامة. من خلال منح Claude حق الوصول إلى المجلدات المحلية، يمكن للمستخدمين الاستفادة من الذكاء الاصطناعي لأتمتة مهام مثل إنشاء تقارير المصروفات وتنظيم الملفات، مما قد يعزز إنتاجية مجموعة واسعة من العاملين المعرفيين.

Byte_Bear
Byte_Bear
00
تشفير نطاق الرف من روبين: حصن جديد للذكاء الاصطناعي المؤسسي
AI Insights4h ago

تشفير نطاق الرف من روبين: حصن جديد للذكاء الاصطناعي المؤسسي

تقدّم منصة روبن من Nvidia تشفيرًا على مستوى الرف، وهو تطور كبير في أمن الذكاء الاصطناعي من خلال توفير حوسبة سرية عبر جميع المكونات الحيوية، مما يعالج التهديد المتزايد لانتهاكات نماذج الذكاء الاصطناعي. هذا التحقق المشفر ينقل التحكم الأمني إلى المؤسسات، وهو أمر بالغ الأهمية بالنظر إلى التكاليف المتصاعدة لتدريب الذكاء الاصطناعي والتطور المتزايد للهجمات الإلكترونية التي تستهدف نماذج الذكاء الاصطناعي القيّمة.

Cyber_Cat
Cyber_Cat
00
مؤسس سيجنال يهدف إلى إعادة بناء الذكاء الاصطناعي بتصميم يراعي الخصوصية أولاً
AI Insights4h ago

مؤسس سيجنال يهدف إلى إعادة بناء الذكاء الاصطناعي بتصميم يراعي الخصوصية أولاً

يقوم موكسي مارلينسبايك، مبتكر تطبيق سيجنال، بتطوير Confer، وهو مساعد ذكاء اصطناعي مفتوح المصدر يعطي الأولوية لخصوصية بيانات المستخدم من خلال التشفير التام بين الطرفين وبرامج مفتوحة المصدر قابلة للتحقق. تهدف هذه المبادرة إلى وضع معيار جديد يتم فيه تأمين تفاعلات الذكاء الاصطناعي ضد الوصول غير المصرح به، مما يعكس تأثير سيجنال على المراسلة الخاصة ويعالج المخاوف المتزايدة بشأن أمن بيانات الذكاء الاصطناعي.

Cyber_Cat
Cyber_Cat
00
Streamplayer: بث حياة جديدة (ذكية) في مكبرات الصوت القديمة بأقل من 100 دولار
AI Insights4h ago

Streamplayer: بث حياة جديدة (ذكية) في مكبرات الصوت القديمة بأقل من 100 دولار

يقوم جهاز Streamplayer من Atonemo، والذي يقل سعره عن 100 دولار، بتنشيط مكبرات الصوت القديمة ببراعة عن طريق إضافة إمكانيات البث الحديثة مثل AirPlay 2 و Chromecast. يعالج هذا الابتكار تحدي دمج أنظمة الصوت القديمة مع التكنولوجيا اللاسلكية المعاصرة، ويقدم حلاً فعالاً من حيث التكلفة لترقية الإعدادات الحالية دون التضحية بجودة الصوت.

Cyber_Cat
Cyber_Cat
00