OpenAI está aprovechando la base de datos de código abierto PostgreSQL para dar soporte a su plataforma ChatGPT y API, que atiende a 800 millones de usuarios. En una declaración hecha el jueves, OpenAI reveló que opera sus servicios en una instancia PostgreSQL de un solo primario, en lugar de una base de datos distribuida o un clúster fragmentado.
El sistema utiliza un Azure PostgreSQL Flexible Server para todas las operaciones de escritura, complementado por casi 50 réplicas de lectura distribuidas en múltiples regiones para manejar las solicitudes de lectura. Según OpenAI, esta configuración procesa millones de consultas por segundo, manteniendo una baja latencia p99 de dos dígitos en milisegundos y logrando una disponibilidad de cinco nueves.
Este enfoque desafía la sabiduría convencional con respecto al escalado de bases de datos y proporciona información valiosa para los arquitectos empresariales que se enfrentan a sistemas a gran escala. La conclusión clave, según OpenAI, es que las decisiones arquitectónicas deben guiarse por patrones de carga de trabajo y limitaciones operativas específicas, en lugar de sucumbir al "pánico de escala" o adoptar opciones de infraestructura de moda. La configuración de PostgreSQL de la compañía demuestra el potencial de los sistemas bien establecidos cuando los equipos se centran en la optimización deliberada en lugar de la re-arquitectura prematura.
Si bien las bases de datos vectoriales a menudo se consideran esenciales para las aplicaciones de IA, el éxito de OpenAI con PostgreSQL destaca la continua relevancia y escalabilidad de las bases de datos relacionales tradicionales. Las bases de datos vectoriales sobresalen en el almacenamiento y la consulta de incrustaciones vectoriales de alta dimensión, que son cruciales para tareas como la búsqueda semántica y los sistemas de recomendación. Sin embargo, PostgreSQL, con las extensiones y optimizaciones apropiadas, también puede manejar datos vectoriales y consultas complejas, ofreciendo una solución de propósito más general.
Las implicaciones del enfoque de OpenAI se extienden más allá de la arquitectura de la base de datos. Sugiere que las organizaciones deben evaluar cuidadosamente sus necesidades y limitaciones específicas antes de adoptar tecnologías complejas o no probadas. Al centrarse en la optimización y aprovechar la infraestructura existente, las empresas pueden lograr potencialmente importantes ganancias de rendimiento y ahorros de costos. Este enfoque también subraya la importancia de una comprensión profunda de las características de la carga de trabajo y los requisitos operativos para tomar decisiones arquitectónicas informadas.
El desarrollo futuro de la infraestructura de base de datos de OpenAI está por verse. Sin embargo, el éxito actual de la compañía con PostgreSQL demuestra el poder del diseño y la optimización reflexivos para lograr una escala masiva. Este enfoque ofrece una valiosa lección para las empresas que navegan por las complejidades de la gestión de datos moderna y la infraestructura de IA.
Discussion
Join the conversation
Be the first to comment