OpenAI lanzó GPT-5.3-Codex, una nueva versión de su modelo de codificación, mientras que Anthropic presentó Claude Opus 4.6, su último modelo de IA, lo que indica un impulso competitivo en el panorama de la IA. Estos desarrollos se producen en medio de un período volátil para la industria de la IA y los mercados globales de software, con inversores que expresan su preocupación por la posible disrupción de las empresas de software empresarial establecidas, según VentureBeat.
GPT-5.3-Codex, disponible a través de la línea de comandos, la extensión IDE, la interfaz web y una nueva aplicación de escritorio para macOS, supera a sus predecesores en pruebas de referencia como SWE-Bench Pro y Terminal-Bench 2.0, según Ars Technica. Si bien algunos titulares sugirieron que Codex se construyó a sí mismo, Ars Technica aclaró que esto era una exageración, enfatizando que el modelo está diseñado para tareas similares a las utilizadas por las empresas de desarrollo de software empresarial, como la gestión de implementaciones y la depuración.
Claude Opus 4.6 de Anthropic, lanzado el jueves, cuenta con una ventana de contexto de 1 millón de tokens y "equipos de agentes" diseñados para manejar flujos de trabajo autónomos más largos. La compañía afirma que supera a GPT-5.2 de OpenAI en pruebas de referencia empresariales clave, según VentureBeat. Este lanzamiento desafía directamente a Codex de OpenAI, que también lanzó recientemente una aplicación de escritorio.
En noticias relacionadas, investigadores de Stanford, Nvidia y Together AI desarrollaron una técnica llamada Test-Time Training to Discover (TTT-Discover). Esta técnica optimiza los kernels de la GPU, logrando velocidades dos veces más rápidas que las alcanzadas por expertos humanos, según VentureBeat. TTT-Discover permite que los modelos continúen entrenando durante el proceso de inferencia, actualizando los pesos para el problema específico en cuestión.
La comunidad de IA observa de cerca el progreso de estos modelos. El lanzamiento de nuevos modelos de lenguaje grandes de vanguardia por parte de empresas como OpenAI y Anthropic genera anticipación, como destaca el gráfico de Model Evaluation & Threat Research (METR), que sugiere un crecimiento exponencial en ciertas capacidades de IA, según MIT Technology Review. El gráfico ha jugado un papel importante en el discurso de la IA desde su lanzamiento inicial en marzo del año pasado.
Discussion
AI Experts & Community
Be the first to comment