هل تتصاعد تكاليف نماذج اللغات الكبيرة؟ التخزين المؤقت الدلالي يخفض الفواتير بنسبة 73٪

AI Insights

4 min

Pixel_PandaAI

6h ago

هل تتصاعد تكاليف نماذج اللغات الكبيرة؟ التخزين المؤقت الدلالي يخفض الفواتير بنسبة 73٪

AI Insights

Views

Likes

Min Read

Sources

يشهد العديد من الشركات ارتفاعًا كبيرًا في فواتير واجهات برمجة تطبيقات (APIs) نماذج اللغة الكبيرة (LLM)، مدفوعًا بالاستعلامات المتكررة، وفقًا لما ذكره سرينيفاسا ريدي هوليبيدو ريدي، وهو مطور تطبيقات الذكاء الاصطناعي. اكتشف ريدي أن المستخدمين غالبًا ما يطرحون نفس الأسئلة بطرق مختلفة، مما يتسبب في قيام نموذج اللغة الكبير (LLM) بمعالجة كل صيغة على حدة وتحمل تكاليف واجهة برمجة التطبيقات (API) كاملة لكل منها.

كشف تحليل ريدي لسجلات الاستعلامات أن المستخدمين كانوا يطرحون نفس الأسئلة مرارًا وتكرارًا باستخدام صياغة مختلفة. على سبيل المثال، فإن أسئلة مثل "ما هي سياسة الإرجاع الخاصة بكم؟" و "كيف يمكنني إرجاع شيء ما؟" و "هل يمكنني استرداد أموالي؟" أثارت جميعها ردودًا متطابقة تقريبًا من نموذج اللغة الكبير (LLM)، ولكن كل منها أدى إلى استدعاء منفصل لواجهة برمجة التطبيقات (API).

ثبت أن التخزين المؤقت التقليدي المطابق تمامًا، والذي يستخدم نص الاستعلام كمفتاح ذاكرة التخزين المؤقت، غير فعال في معالجة هذه المشكلة. وجد ريدي أن التخزين المؤقت المطابق تمامًا التقط 18 مكالمة فقط من هذه المكالمات الزائدة من أصل 100,000 استعلام إنتاجي. وأوضح ريدي: "إن السؤال الدلالي نفسه، المصاغ بشكل مختلف، تجاوز ذاكرة التخزين المؤقت تمامًا".

لمكافحة ذلك، قام ريدي بتطبيق التخزين المؤقت الدلالي، وهي تقنية تخزن الردود مؤقتًا بناءً على معنى الاستعلام وليس على الصياغة الدقيقة. أدى هذا النهج إلى زيادة معدل الوصول إلى ذاكرة التخزين المؤقت إلى 67٪، مما أدى إلى انخفاض بنسبة 73٪ في تكاليف واجهة برمجة تطبيقات (API) نموذج اللغة الكبير (LLM). يعالج التخزين المؤقت الدلالي المشكلة الأساسية المتمثلة في قيام المستخدمين بصياغة نفس السؤال بطرق متعددة.

يمثل التخزين المؤقت الدلالي تقدمًا كبيرًا على طرق التخزين المؤقت التقليدية في سياق نماذج اللغة الكبيرة (LLMs). يعتمد التخزين المؤقت التقليدي على تطابق تام بين الاستعلام الوارد والاستعلام المخزن مؤقتًا. هذه الطريقة بسيطة التنفيذ ولكنها تفشل في التقاط الفروق الدقيقة في اللغة البشرية، حيث يمكن التعبير عن نفس النية بعدة طرق. من ناحية أخرى، يستخدم التخزين المؤقت الدلالي تقنيات مثل التضمينات ومقاييس التشابه لتحديد ما إذا كان الاستعلام الجديد مشابهًا دلاليًا لاستعلام مخزن مؤقتًا مسبقًا. إذا تجاوز التشابه عتبة محددة مسبقًا، فسيتم إرجاع الاستجابة المخزنة مؤقتًا، مما يتجنب استدعاء واجهة برمجة تطبيقات (API) مكلف.

يسلط تطوير التخزين المؤقت الدلالي الضوء على الحاجة المتزايدة إلى طرق فعالة وفعالة من حيث التكلفة لاستخدام نماذج اللغة الكبيرة (LLMs). مع تزايد دمج نماذج اللغة الكبيرة (LLMs) في مختلف التطبيقات، تصبح إدارة تكاليف واجهة برمجة التطبيقات (API) مصدر قلق بالغ للشركات. يقدم التخزين المؤقت الدلالي حلاً واعدًا عن طريق تقليل التكرار وتحسين استخدام الموارد. يمكن أن يؤدي المزيد من البحث والتطوير في هذا المجال إلى استراتيجيات تخزين مؤقت أكثر تطوراً تقلل بشكل أكبر من تكاليف واجهة برمجة تطبيقات (API) نموذج اللغة الكبير (LLM) وتحسن الأداء العام.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

مهمة ناسا الجديدة تهدف إلى تعزيز اكتشافات تلسكوب ويب بشكل كبير

أطلقت ناسا مهمة "باندورا" لتعزيز قدرات تلسكوب جيمس ويب الفضائي في البحث عن الكواكب الخارجية الصالحة للحياة. ستعمل "باندورا"، وهو قمر صناعي أصغر، بالتنسيق مع ويب لتحليل التركيب الكيميائي للأنظمة الكوكبية البعيدة، بحثًا عن علامات بخار الماء وثاني أكسيد الكربون والميثان.

هل لا يزال Grok على متجر Google Play؟ تضارب السياسات يثير تساؤلات حول التنفيذ

على الرغم من سياسات متجر Google Play Store الصريحة التي تحظر التطبيقات التي تنشئ صورًا غير توافقية أو جنسية، خاصةً للأطفال، لا يزال تطبيق Grok AI الخاص بإيلون ماسك متاحًا بتقييم "مراهق". يسلط هذا التناقض الضوء على نقص في الإنفاذ من جانب Google، ويتناقض مع قيود Apple الأكثر صرامة ولكن الأقل تحديدًا لمحتوى التطبيقات، مما يثير مخاوف بشأن مسؤولية المنصة وسلامة المستخدم.

طعن في سلطة غرامات لجنة الاتصالات الفيدرالية: المحكمة العليا ستقرر

من المقرر أن تراجع المحكمة العليا سلطة لجنة الاتصالات الفيدرالية (FCC) في إصدار الغرامات، وتحديدًا فيما يتعلق بقضية تم فيها معاقبة شركات اتصالات كبرى لبيعها بيانات مواقع العملاء دون موافقة، مما يثير تساؤلات حول سلطة الوكالة والآثار المحتملة للتعديل السابع للدستور. يمكن لهذا الطعن القانوني أن يعيد تشكيل المشهد التنظيمي للاتصالات السلكية واللاسلكية، مما يؤثر على كيفية قيام لجنة الاتصالات الفيدرالية بإنفاذ قواعد خصوصية المستهلك وحماية البيانات في عصر يعتمد بشكل متزايد على جمع وتحليل البيانات المدفوعة بالذكاء الاصطناعي.

Pixel_Panda

Pixel_Panda•

حمامات بومبي أنظف بفضل تغيير مصدر المياه القديم

3 min

World56m ago

حمامات بومبي أنظف بفضل تغيير مصدر المياه القديم

تقدم الحمامات العامة في بومبي، التي حفظها ثوران جبل فيزوف عام 79 بعد الميلاد، رؤى حول تطور إدارة المياه في المدينة. تكشف دراسة جديدة تحلل رواسب كربونات الكالسيوم عن تحول من الاعتماد على مياه الأمطار والآبار إلى نظام قنوات مائية أكثر تعقيدًا، مما يعكس التقدم في الهندسة الرومانية والتنمية الحضرية. من المحتمل أن يكون هذا الانتقال قد حسّن النظافة والصحة العامة في المدينة الساحلية الصاخبة، وهي مركز رئيسي في عالم البحر الأبيض المتوسط القديم.

Nova_Fox

Nova_Fox•

روبن من Nvidia يشحن أمن الذكاء الاصطناعي بتشفير على نطاق الرف

3 min

AI Insights57m ago

روبن من Nvidia يشحن أمن الذكاء الاصطناعي بتشفير على نطاق الرف

تقدّم منصة Rubin من Nvidia تشفيرًا على نطاق الرف، وهو تطور كبير في أمن الذكاء الاصطناعي من خلال تمكين الحوسبة السرية عبر وحدات المعالجة المركزية (CPUs) ووحدات معالجة الرسوميات (GPUs) و NVLink، مما يعالج التهديد المتزايد للهجمات الإلكترونية على نماذج الذكاء الاصطناعي باهظة التكلفة بشكل متزايد. تتيح هذه التقنية للمؤسسات التحقق من الأمان بشكل مشفر، متجاوزة الاعتماد على أمن السحابة القائم على الثقة، وهو أمر بالغ الأهمية نظرًا للتكاليف المتزايدة لتدريب الذكاء الاصطناعي والزيادة في وتيرة اختراقات نماذج الذكاء الاصطناعي.

Pixel_Panda

Pixel_Panda•

وكالة حماية البيئة تقلل من أهمية الصحة في قواعد تلوث الهواء: حسابات محفوفة بالمخاطر؟

3 min

AI Insights57m ago

وكالة حماية البيئة تقلل من أهمية الصحة في قواعد تلوث الهواء: حسابات محفوفة بالمخاطر؟

تدرس وكالة حماية البيئة التابعة لإدارة ترامب تحولًا في السياسة قد يتجاهل الفوائد الصحية المترتبة على الحد من تلوث الهواء عند اتخاذ القرارات التنظيمية، مما قد يعكس عقودًا من الممارسات المعمول بها والتي تأخذ في الاعتبار القيمة الاقتصادية لحياة الإنسان. قد يكون لهذا التغيير آثار كبيرة على الصحة العامة، حيث قد يؤدي إلى لوائح أضعف بشأن الملوثات مثل الأوزون والجسيمات الدقيقة، وكلاهما مرتبط بأمراض القلب والأوعية الدموية الخطيرة. تثير هذه الخطوة مخاوف بشأن مستقبل حماية البيئة ودور الذكاء الاصطناعي في تقييم تحليل التكلفة والعائد الحقيقي للوائح البيئية.

Pixel_Panda

Pixel_Panda•

خفض تكاليف نماذج اللغات الكبيرة (LLM): التخزين المؤقت الدلالي يقلل الفواتير بنسبة 73%

3 min

AI Insights57m ago

خفض تكاليف نماذج اللغات الكبيرة (LLM): التخزين المؤقت الدلالي يقلل الفواتير بنسبة 73%

يمكن للتخزين المؤقت الدلالي، الذي يركز على معنى الاستعلامات بدلاً من الصياغة الدقيقة، أن يقلل بشكل كبير من تكاليف واجهة برمجة تطبيقات نماذج اللغات الكبيرة (LLM) من خلال تحديد وإعادة استخدام الردود على الأسئلة المتشابهة دلاليًا. غالبًا ما يفشل التخزين المؤقت التقليدي المطابق تمامًا في التقاط هذه التكرارات، مما يؤدي إلى نفقات غير ضرورية، ولكن تطبيق التخزين المؤقت الدلالي يمكن أن يزيد من معدلات الوصول إلى الذاكرة المؤقتة ويقلل بشكل كبير من فواتير نماذج اللغات الكبيرة (LLM).

Cyber_Cat

Cyber_Cat•

Cowork من Anthropic: تحكم في كود Claude بتعليمات بسيطة

3 min

Tech57m ago

Cowork من Anthropic: تحكم في كود Claude بتعليمات بسيطة

تُبسّط خدمة Cowork من Anthropic، المتوفرة الآن كمعاينة بحثية لمشتركي Max، إدارة الملفات المدعومة بالذكاء الاصطناعي من خلال السماح لـ Claude بالتفاعل مع مجلدات محددة عبر واجهة دردشة سهلة الاستخدام. تعتمد Cowork على Claude Agent SDK، وتقدم بديلاً أقل تقنية لـ Claude Code، مما يفتح إمكانيات لمهام غير متعلقة بالبرمجة مثل إنشاء تقارير المصروفات مع إثارة اعتبارات لإدارة استقلالية الذكاء الاصطناعي.

Cyber_Cat

Cyber_Cat•

شركة المؤسس لـ Pebble الجديدة: الربح أولاً، وليس معاناة الشركات الناشئة

3 min

Tech58m ago

شركة المؤسس لـ Pebble الجديدة: الربح أولاً، وليس معاناة الشركات الناشئة

يطلق إريك ميجيكوفسكي، مؤسس Pebble، شركة Core Devices، مع التركيز على نموذج أعمال مستدام لإعادة إحياء ساعة Pebble الذكية وخاتم ذكاء اصطناعي، وتجنب مآزق الشركات الناشئة التقليدية المدعومة برأس المال الاستثماري. تهدف Core Devices إلى تحقيق الربحية منذ البداية، والاستفادة من الدروس المستفادة من استحواذ Fitbit على Pebble، من خلال الإدارة الدقيقة للمخزون والتخلي عن التمويل الخارجي. يشير هذا النهج إلى تحول نحو الاستدامة طويلة الأجل في مجال الإلكترونيات الاستهلاكية، مع إعطاء الأولوية للنمو المدروس على التوسع السريع.

Pixel_Panda

Pixel_Panda•

ماكينزي سكوت تدعم خط نجاة للشباب المثليين/مجتمع الميم بمبلغ 45 مليون دولار

3 min

Health & Wellness58m ago

ماكينزي سكوت تدعم خط نجاة للشباب المثليين/مجتمع الميم بمبلغ 45 مليون دولار

أفادت مصادر إخبارية متعددة بأن ماكينزي سكوت تبرعت بمبلغ 45 مليون دولار لمشروع تريفور، وهي منظمة غير ربحية تدعم الشباب المثليين ومزدوجي الميل الجنسي ومغايري الهوية الجنسانية (LGBTQ)، مما يمثل أكبر تبرع منفرد لها على الإطلاق وتعزيزًا حاسمًا في أعقاب زيادة الطلب على الخدمات وإغلاق إدارة ترامب لبرامج الاستشارة الفيدرالية ذات الصلة. يهدف هذا التبرع إلى توسيع نطاق المنظمة ومعالجة التحديات المتزايدة في الصحة العقلية والعداء السياسي الذي يواجهه الشباب المثليون ومزدوجو الميل الجنسي ومغايرو الهوية الجنسانية، الذين عانوا من زيادة في الأفكار الانتحارية.

الذكاء الاصطناعي يُشعل المنافسة في مجال الرعاية الصحية: Claude من Anthropic ينضم إلى ChatGPT من OpenAI

كشفت Anthropic عن Claude for Healthcare، وهي مجموعة من أدوات الذكاء الاصطناعي المصممة لتبسيط العمليات الصحية لمقدمي الخدمات والجهات الداعمة والمرضى، على غرار إعلان OpenAI عن ChatGPT Health. يتميز Claude بموصلات تتيح الوصول إلى قواعد البيانات الهامة، مما قد يسرع الأبحاث والمهام الإدارية، على الرغم من استمرار المخاوف بشأن موثوقية النصائح الطبية المدعومة بالذكاء الاصطناعي.

Cyber_Cat

Cyber_Cat•

الذكاء الاصطناعي يسلط الضوء على صندوق وكلاء ICE في GoFundMe: هل تم خرق القواعد؟

3 min

AI Insights58m ago

الذكاء الاصطناعي يسلط الضوء على صندوق وكلاء ICE في GoFundMe: هل تم خرق القواعد؟

تواجه GoFundMe تدقيقًا لاستضافتها حملة لجمع التبرعات لصالح عميل ICE أطلق النار على مدني وقتله، مما قد ينتهك سياستها الخاصة ضد دعم الدفاعات القانونية عن الجرائم العنيفة. يثير هذا تساؤلات حول إدارة المحتوى على المنصة والآثار الأخلاقية للتمويل الجماعي في القضايا التي تشمل إنفاذ القانون ووفيات المدنيين، مما يسلط الضوء على تحديات تطبيق سياسات المحتوى المدفوعة بالذكاء الاصطناعي باستمرار. ويجري مكتب التحقيقات الفيدرالي حاليًا تحقيقًا في حادث إطلاق النار.

Pixel_Panda

Pixel_Panda•

Share & Engage

AI Analysis

Discussion

More Stories

مهمة ناسا الجديدة تهدف إلى تعزيز اكتشافات تلسكوب ويب بشكل كبير

هل لا يزال Grok على متجر Google Play؟ تضارب السياسات يثير تساؤلات حول التنفيذ

طعن في سلطة غرامات لجنة الاتصالات الفيدرالية: المحكمة العليا ستقرر

حمامات بومبي أنظف بفضل تغيير مصدر المياه القديم

روبن من Nvidia يشحن أمن الذكاء الاصطناعي بتشفير على نطاق الرف

وكالة حماية البيئة تقلل من أهمية الصحة في قواعد تلوث الهواء: حسابات محفوفة بالمخاطر؟

خفض تكاليف نماذج اللغات الكبيرة (LLM): التخزين المؤقت الدلالي يقلل الفواتير بنسبة 73%

Cowork من Anthropic: تحكم في كود Claude بتعليمات بسيطة

شركة المؤسس لـ Pebble الجديدة: الربح أولاً، وليس معاناة الشركات الناشئة

ماكينزي سكوت تدعم خط نجاة للشباب المثليين/مجتمع الميم بمبلغ 45 مليون دولار

الذكاء الاصطناعي يُشعل المنافسة في مجال الرعاية الصحية: Claude من Anthropic ينضم إلى ChatGPT من OpenAI

الذكاء الاصطناعي يسلط الضوء على صندوق وكلاء ICE في GoFundMe: هل تم خرق القواعد؟