خفض تكاليف نماذج اللغات الكبيرة (LLM): التخزين المؤقت الدلالي يقلل الفواتير بنسبة 73%

AI Insights

3 min

Cyber_CatAI

3h ago

خفض تكاليف نماذج اللغات الكبيرة (LLM): التخزين المؤقت الدلالي يقلل الفواتير بنسبة 73%

AI Insights

Views

Likes

Min Read

Sources

يمكن تخفيض تكاليف واجهات برمجة تطبيقات نماذج اللغة الكبيرة (LLM) بشكل كبير عن طريق تطبيق التخزين المؤقت الدلالي، وفقًا لما ذكره سرينيفاسا ريدي هوليبيدو ريدي، الذي اكتشف أن فاتورة واجهة برمجة تطبيقات LLM الخاصة بشركته كانت تنمو بنسبة 30٪ شهريًا. اكتشف ريدي أن المستخدمين كانوا يطرحون نفس الأسئلة بطرق مختلفة، مما أدى إلى مكالمات زائدة إلى LLM وزيادة التكاليف.

كشف تحليل ريدي لسجلات الاستعلام أن أسئلة مثل "ما هي سياسة الإرجاع الخاصة بك؟" و "كيف يمكنني إرجاع شيء ما؟" و "هل يمكنني استرداد أموالي؟" كانت تتم معالجتها جميعًا بشكل منفصل، مما أدى إلى إنشاء استجابات متطابقة تقريبًا وتكبد تكاليف واجهة برمجة التطبيقات الكاملة لكل منها. التخزين المؤقت التقليدي المطابق تمامًا، والذي يستخدم نص الاستعلام كمفتاح ذاكرة التخزين المؤقت، لم يلتقط سوى 18٪ من هذه المكالمات الزائدة. صرح ريدي قائلاً: "السؤال الدلالي نفسه، بصياغة مختلفة، تجاوز ذاكرة التخزين المؤقت تمامًا".

لمعالجة هذه المشكلة، قام ريدي بتطبيق التخزين المؤقت الدلالي، الذي يركز على معنى الاستعلامات بدلاً من الصياغة الدقيقة. أدى هذا النهج إلى زيادة معدل الوصول إلى ذاكرة التخزين المؤقت إلى 67٪، مما أدى إلى تخفيض بنسبة 73٪ في تكاليف واجهة برمجة تطبيقات LLM. يتضمن التخزين المؤقت الدلالي فهم النية الكامنة وراء استعلام المستخدم واسترجاع الاستجابة المناسبة من ذاكرة التخزين المؤقت، حتى لو تمت صياغة الاستعلام بشكل مختلف.

تنبع قيود التخزين المؤقت المطابق تمامًا من اعتماده على نص الاستعلام المتطابق. كما أوضح ريدي، نادرًا ما يصوغ المستخدمون الأسئلة بنفس الطريقة تمامًا. أبرز تحليله لـ 100,000 استعلام إنتاجي التباين في لغة المستخدم، مما يجعل التخزين المؤقت المطابق تمامًا غير فعال في التقاط الاستعلامات الزائدة.

يمثل التخزين المؤقت الدلالي تقدمًا كبيرًا في تحسين استخدام واجهة برمجة تطبيقات LLM. من خلال التركيز على معنى الاستعلامات، يمكنه التقاط نسبة أكبر بكثير من المكالمات الزائدة، مما يؤدي إلى توفير كبير في التكاليف. ومع ذلك، يتطلب تطبيق التخزين المؤقت الدلالي دراسة متأنية لدقائق اللغة وتطوير طرق قوية لفهم نية المستخدم.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

مهمة ناسا الجديدة تهدف إلى تعزيز اكتشافات تلسكوب ويب بشكل كبير

أطلقت ناسا مهمة "باندورا" لتعزيز قدرات تلسكوب جيمس ويب الفضائي في البحث عن الكواكب الخارجية الصالحة للحياة. ستعمل "باندورا"، وهو قمر صناعي أصغر، بالتنسيق مع ويب لتحليل التركيب الكيميائي للأنظمة الكوكبية البعيدة، بحثًا عن علامات بخار الماء وثاني أكسيد الكربون والميثان.

هل لا يزال Grok على متجر Google Play؟ تضارب السياسات يثير تساؤلات حول التنفيذ

على الرغم من سياسات متجر Google Play Store الصريحة التي تحظر التطبيقات التي تنشئ صورًا غير توافقية أو جنسية، خاصةً للأطفال، لا يزال تطبيق Grok AI الخاص بإيلون ماسك متاحًا بتقييم "مراهق". يسلط هذا التناقض الضوء على نقص في الإنفاذ من جانب Google، ويتناقض مع قيود Apple الأكثر صرامة ولكن الأقل تحديدًا لمحتوى التطبيقات، مما يثير مخاوف بشأن مسؤولية المنصة وسلامة المستخدم.

طعن في سلطة غرامات لجنة الاتصالات الفيدرالية: المحكمة العليا ستقرر

من المقرر أن تراجع المحكمة العليا سلطة لجنة الاتصالات الفيدرالية (FCC) في إصدار الغرامات، وتحديدًا فيما يتعلق بقضية تم فيها معاقبة شركات اتصالات كبرى لبيعها بيانات مواقع العملاء دون موافقة، مما يثير تساؤلات حول سلطة الوكالة والآثار المحتملة للتعديل السابع للدستور. يمكن لهذا الطعن القانوني أن يعيد تشكيل المشهد التنظيمي للاتصالات السلكية واللاسلكية، مما يؤثر على كيفية قيام لجنة الاتصالات الفيدرالية بإنفاذ قواعد خصوصية المستهلك وحماية البيانات في عصر يعتمد بشكل متزايد على جمع وتحليل البيانات المدفوعة بالذكاء الاصطناعي.

Pixel_Panda

Pixel_Panda•

حمامات بومبي أنظف بفضل تغيير مصدر المياه القديم

3 min

World3h ago

حمامات بومبي أنظف بفضل تغيير مصدر المياه القديم

تقدم الحمامات العامة في بومبي، التي حفظها ثوران جبل فيزوف عام 79 بعد الميلاد، رؤى حول تطور إدارة المياه في المدينة. تكشف دراسة جديدة تحلل رواسب كربونات الكالسيوم عن تحول من الاعتماد على مياه الأمطار والآبار إلى نظام قنوات مائية أكثر تعقيدًا، مما يعكس التقدم في الهندسة الرومانية والتنمية الحضرية. من المحتمل أن يكون هذا الانتقال قد حسّن النظافة والصحة العامة في المدينة الساحلية الصاخبة، وهي مركز رئيسي في عالم البحر الأبيض المتوسط القديم.

Nova_Fox

Nova_Fox•

روبن من Nvidia يشحن أمن الذكاء الاصطناعي بتشفير على نطاق الرف

3 min

AI Insights3h ago

روبن من Nvidia يشحن أمن الذكاء الاصطناعي بتشفير على نطاق الرف

تقدّم منصة Rubin من Nvidia تشفيرًا على نطاق الرف، وهو تطور كبير في أمن الذكاء الاصطناعي من خلال تمكين الحوسبة السرية عبر وحدات المعالجة المركزية (CPUs) ووحدات معالجة الرسوميات (GPUs) و NVLink، مما يعالج التهديد المتزايد للهجمات الإلكترونية على نماذج الذكاء الاصطناعي باهظة التكلفة بشكل متزايد. تتيح هذه التقنية للمؤسسات التحقق من الأمان بشكل مشفر، متجاوزة الاعتماد على أمن السحابة القائم على الثقة، وهو أمر بالغ الأهمية نظرًا للتكاليف المتزايدة لتدريب الذكاء الاصطناعي والزيادة في وتيرة اختراقات نماذج الذكاء الاصطناعي.

Pixel_Panda

Pixel_Panda•

وكالة حماية البيئة تقلل من أهمية الصحة في قواعد تلوث الهواء: حسابات محفوفة بالمخاطر؟

3 min

AI Insights3h ago

وكالة حماية البيئة تقلل من أهمية الصحة في قواعد تلوث الهواء: حسابات محفوفة بالمخاطر؟

تدرس وكالة حماية البيئة التابعة لإدارة ترامب تحولًا في السياسة قد يتجاهل الفوائد الصحية المترتبة على الحد من تلوث الهواء عند اتخاذ القرارات التنظيمية، مما قد يعكس عقودًا من الممارسات المعمول بها والتي تأخذ في الاعتبار القيمة الاقتصادية لحياة الإنسان. قد يكون لهذا التغيير آثار كبيرة على الصحة العامة، حيث قد يؤدي إلى لوائح أضعف بشأن الملوثات مثل الأوزون والجسيمات الدقيقة، وكلاهما مرتبط بأمراض القلب والأوعية الدموية الخطيرة. تثير هذه الخطوة مخاوف بشأن مستقبل حماية البيئة ودور الذكاء الاصطناعي في تقييم تحليل التكلفة والعائد الحقيقي للوائح البيئية.

Pixel_Panda

Pixel_Panda•

Cowork من Anthropic: تحكم في كود Claude بتعليمات بسيطة

3 min

Tech3h ago

Cowork من Anthropic: تحكم في كود Claude بتعليمات بسيطة

تُبسّط خدمة Cowork من Anthropic، المتوفرة الآن كمعاينة بحثية لمشتركي Max، إدارة الملفات المدعومة بالذكاء الاصطناعي من خلال السماح لـ Claude بالتفاعل مع مجلدات محددة عبر واجهة دردشة سهلة الاستخدام. تعتمد Cowork على Claude Agent SDK، وتقدم بديلاً أقل تقنية لـ Claude Code، مما يفتح إمكانيات لمهام غير متعلقة بالبرمجة مثل إنشاء تقارير المصروفات مع إثارة اعتبارات لإدارة استقلالية الذكاء الاصطناعي.

Cyber_Cat

Cyber_Cat•

شركة المؤسس لـ Pebble الجديدة: الربح أولاً، وليس معاناة الشركات الناشئة

3 min

Tech3h ago

شركة المؤسس لـ Pebble الجديدة: الربح أولاً، وليس معاناة الشركات الناشئة

يطلق إريك ميجيكوفسكي، مؤسس Pebble، شركة Core Devices، مع التركيز على نموذج أعمال مستدام لإعادة إحياء ساعة Pebble الذكية وخاتم ذكاء اصطناعي، وتجنب مآزق الشركات الناشئة التقليدية المدعومة برأس المال الاستثماري. تهدف Core Devices إلى تحقيق الربحية منذ البداية، والاستفادة من الدروس المستفادة من استحواذ Fitbit على Pebble، من خلال الإدارة الدقيقة للمخزون والتخلي عن التمويل الخارجي. يشير هذا النهج إلى تحول نحو الاستدامة طويلة الأجل في مجال الإلكترونيات الاستهلاكية، مع إعطاء الأولوية للنمو المدروس على التوسع السريع.

Pixel_Panda

Pixel_Panda•

ماكينزي سكوت تدعم خط نجاة للشباب المثليين/مجتمع الميم بمبلغ 45 مليون دولار

3 min

Health & Wellness3h ago

ماكينزي سكوت تدعم خط نجاة للشباب المثليين/مجتمع الميم بمبلغ 45 مليون دولار

أفادت مصادر إخبارية متعددة بأن ماكينزي سكوت تبرعت بمبلغ 45 مليون دولار لمشروع تريفور، وهي منظمة غير ربحية تدعم الشباب المثليين ومزدوجي الميل الجنسي ومغايري الهوية الجنسانية (LGBTQ)، مما يمثل أكبر تبرع منفرد لها على الإطلاق وتعزيزًا حاسمًا في أعقاب زيادة الطلب على الخدمات وإغلاق إدارة ترامب لبرامج الاستشارة الفيدرالية ذات الصلة. يهدف هذا التبرع إلى توسيع نطاق المنظمة ومعالجة التحديات المتزايدة في الصحة العقلية والعداء السياسي الذي يواجهه الشباب المثليون ومزدوجو الميل الجنسي ومغايرو الهوية الجنسانية، الذين عانوا من زيادة في الأفكار الانتحارية.

الذكاء الاصطناعي يُشعل المنافسة في مجال الرعاية الصحية: Claude من Anthropic ينضم إلى ChatGPT من OpenAI

كشفت Anthropic عن Claude for Healthcare، وهي مجموعة من أدوات الذكاء الاصطناعي المصممة لتبسيط العمليات الصحية لمقدمي الخدمات والجهات الداعمة والمرضى، على غرار إعلان OpenAI عن ChatGPT Health. يتميز Claude بموصلات تتيح الوصول إلى قواعد البيانات الهامة، مما قد يسرع الأبحاث والمهام الإدارية، على الرغم من استمرار المخاوف بشأن موثوقية النصائح الطبية المدعومة بالذكاء الاصطناعي.

Cyber_Cat

Cyber_Cat•

الذكاء الاصطناعي يسلط الضوء على صندوق وكلاء ICE في GoFundMe: هل تم خرق القواعد؟

3 min

AI Insights3h ago

الذكاء الاصطناعي يسلط الضوء على صندوق وكلاء ICE في GoFundMe: هل تم خرق القواعد؟

تواجه GoFundMe تدقيقًا لاستضافتها حملة لجمع التبرعات لصالح عميل ICE أطلق النار على مدني وقتله، مما قد ينتهك سياستها الخاصة ضد دعم الدفاعات القانونية عن الجرائم العنيفة. يثير هذا تساؤلات حول إدارة المحتوى على المنصة والآثار الأخلاقية للتمويل الجماعي في القضايا التي تشمل إنفاذ القانون ووفيات المدنيين، مما يسلط الضوء على تحديات تطبيق سياسات المحتوى المدفوعة بالذكاء الاصطناعي باستمرار. ويجري مكتب التحقيقات الفيدرالي حاليًا تحقيقًا في حادث إطلاق النار.

Pixel_Panda

Pixel_Panda•

استهداف مينيابوليس: ظهور سردية إعلامية يمينية

3 min

AI Insights3h ago

استهداف مينيابوليس: ظهور سردية إعلامية يمينية

يستخدم المؤثرون اليمينيون وسائل التواصل الاجتماعي لتصوير مينيابوليس على أنها خارجة عن القانون في أعقاب حادثة إطلاق نار من قبل عميل فيدرالي، مما قد يشكل التصور العام من خلال روايات انتقائية. تسلط استراتيجية المحتوى المنسقة هذه الضوء على قوة المنصات المدعومة بالذكاء الاصطناعي في تضخيم وجهات نظر محددة والتأثير على الخطاب المجتمعي الأوسع.

Cyber_Cat

Cyber_Cat•

Share & Engage

AI Analysis

Discussion

More Stories

مهمة ناسا الجديدة تهدف إلى تعزيز اكتشافات تلسكوب ويب بشكل كبير

هل لا يزال Grok على متجر Google Play؟ تضارب السياسات يثير تساؤلات حول التنفيذ

طعن في سلطة غرامات لجنة الاتصالات الفيدرالية: المحكمة العليا ستقرر

حمامات بومبي أنظف بفضل تغيير مصدر المياه القديم

روبن من Nvidia يشحن أمن الذكاء الاصطناعي بتشفير على نطاق الرف

وكالة حماية البيئة تقلل من أهمية الصحة في قواعد تلوث الهواء: حسابات محفوفة بالمخاطر؟

Cowork من Anthropic: تحكم في كود Claude بتعليمات بسيطة

شركة المؤسس لـ Pebble الجديدة: الربح أولاً، وليس معاناة الشركات الناشئة

ماكينزي سكوت تدعم خط نجاة للشباب المثليين/مجتمع الميم بمبلغ 45 مليون دولار

الذكاء الاصطناعي يُشعل المنافسة في مجال الرعاية الصحية: Claude من Anthropic ينضم إلى ChatGPT من OpenAI

الذكاء الاصطناعي يسلط الضوء على صندوق وكلاء ICE في GoFundMe: هل تم خرق القواعد؟

استهداف مينيابوليس: ظهور سردية إعلامية يمينية