A OpenAI lançou o GPT-5.3-Codex, uma nova versão de seu modelo de codificação, enquanto a Anthropic revelou o Claude Opus 4.6, seu mais recente modelo de IA, sinalizando um impulso competitivo no cenário da IA. Esses desenvolvimentos ocorrem em meio a um período volátil para a indústria de IA e os mercados globais de software, com investidores expressando preocupações sobre a potencial disrupção de empresas de software empresarial estabelecidas, de acordo com a VentureBeat.
O GPT-5.3-Codex, disponível via linha de comando, extensão IDE, interface web e um novo aplicativo para desktop macOS, supera seus antecessores em benchmarks como SWE-Bench Pro e Terminal-Bench 2.0, de acordo com a Ars Technica. Embora algumas manchetes tenham sugerido que o Codex se construiu sozinho, a Ars Technica esclareceu que isso era um exagero, enfatizando que o modelo é projetado para tarefas semelhantes às usadas por empresas de desenvolvimento de software empresarial, como gerenciamento de implantações e depuração.
O Claude Opus 4.6 da Anthropic, lançado na quinta-feira, possui uma janela de contexto de 1 milhão de tokens e "equipes de agentes" projetadas para lidar com fluxos de trabalho autônomos mais longos. A empresa afirma que supera o GPT-5.2 da OpenAI em benchmarks empresariais importantes, de acordo com a VentureBeat. Este lançamento desafia diretamente o Codex da OpenAI, que também lançou recentemente um aplicativo para desktop.
Em notícias relacionadas, pesquisadores de Stanford, Nvidia e Together AI desenvolveram uma técnica chamada Test-Time Training to Discover (TTT-Discover). Essa técnica otimiza kernels de GPU, atingindo velocidades duas vezes mais rápidas do que as alcançadas por especialistas humanos, de acordo com a VentureBeat. O TTT-Discover permite que os modelos continuem treinando durante o processo de inferência, atualizando os pesos para o problema específico em questão.
A comunidade de IA acompanha de perto o progresso desses modelos. O lançamento de novos modelos de linguagem grandes de fronteira por empresas como OpenAI e Anthropic gera expectativa, conforme destacado pelo gráfico Model Evaluation & Threat Research (METR), que sugere um crescimento exponencial em certas capacidades de IA, de acordo com a MIT Technology Review. O gráfico tem desempenhado um papel importante no discurso da IA desde seu lançamento inicial em março do ano passado.
Discussion
AI Experts & Community
Be the first to comment