تستفيد OpenAI من قاعدة بيانات PostgreSQL مفتوحة المصدر لدعم منصة ChatGPT وواجهة برمجة التطبيقات (API) الخاصة بها، والتي تخدم 800 مليون مستخدم. في منشور مدونة نُشر يوم الخميس، كشفت OpenAI أنها تدير قاعدة مستخدميها الضخمة على مثيل PostgreSQL أساسي واحد، بدلاً من قاعدة بيانات موزعة أو مجموعة مقسمة.
يستخدم التكوين خادم Azure PostgreSQL Flexible Server واحدًا لجميع عمليات الكتابة، مع ما يقرب من 50 نسخة طبق الأصل للقراءة موزعة عبر مناطق متعددة للتعامل مع طلبات القراءة. وفقًا لـ OpenAI، يدير النظام ملايين الاستعلامات في الثانية مع الحفاظ على زمن انتقال منخفض برقمين بالملي ثانية (p99) وتوافر خمسة تسعات.
يتحدى هذا النهج الحكمة التقليدية فيما يتعلق بتوسيع نطاق قاعدة البيانات، ويقدم رؤى قيمة لمهندسي المؤسسات الذين يتعاملون مع الأنظمة واسعة النطاق. أكدت الشركة على أن الاستنتاج الرئيسي ليس تكرار البنية التحتية المحددة لـ OpenAI، ولكن بالأحرى إعطاء الأولوية لأنماط أعباء العمل والقيود التشغيلية عند اتخاذ القرارات المعمارية، بدلاً من الاستجابة لتحديات التوسع المتصورة أو تبني التقنيات الرائجة دون دراسة متأنية.
يسلط قرار الاعتماد على PostgreSQL الضوء على إمكانات الأنظمة الراسخة عندما تركز الفرق على التحسين المتعمد بدلاً من إعادة التصميم المبكرة. في حين أن قواعد بيانات المتجهات قد اكتسبت قوة جذب لتطبيقات الذكاء الاصطناعي المحددة، فإن حالة استخدام OpenAI توضح أن قواعد البيانات العلائقية التقليدية لا تزال قادرة على التعامل بفعالية مع أعباء العمل الضخمة مع التكوين والتحسين المناسبين.
تمتد آثار نهج OpenAI إلى ما وراء بنية قاعدة البيانات. يشير إلى أنه يجب على المؤسسات تقييم احتياجاتها وقيودها المحددة بعناية قبل تبني حلول معقدة وربما غير ضرورية. من خلال التركيز على تحسين الأنظمة الحالية، يمكن للشركات تحقيق مكاسب كبيرة في الأداء وتوفير التكاليف.
يؤكد نجاح OpenAI مع PostgreSQL على أهمية فهم المفاضلات بين تقنيات قواعد البيانات المختلفة والأنماط المعمارية. في حين أن قواعد البيانات الموزعة والمجموعات المقسمة توفر فوائد قابلية التوسع، فإنها تقدم أيضًا تعقيدًا ونفقات تشغيلية. في بعض الحالات، قد تكون قاعدة بيانات ذات مثيل واحد مُحسَّنة جيدًا حلاً أكثر كفاءة وفعالية من حيث التكلفة.
لم تكشف الشركة بعد عن تفاصيل محددة حول تقنيات التحسين التي استخدمتها لتحقيق هذا المستوى من الأداء. ومع ذلك، يشير منشور المدونة إلى أن الاهتمام الدقيق بأنماط أعباء العمل وتحسين الاستعلام وتكوين البنية التحتية لعب دورًا حاسمًا. من المتوقع إصدار مزيد من التفاصيل في الأشهر المقبلة، مما يوفر رؤى قيمة لمسؤولي قواعد البيانات والمهندسين المعماريين الذين يتطلعون إلى توسيع نطاق عمليات نشر PostgreSQL الخاصة بهم.
Discussion
Join the conversation
Be the first to comment