AI Войны: OpenAI, Anthropic и TTT-Discover Борются за Господство

OpenAI выпустила GPT-5.3-Codex, новую версию своей модели для кодирования, а Anthropic представила Claude Opus 4.6, свою последнюю модель ИИ, сигнализируя о конкурентной борьбе в сфере ИИ. Эти события происходят в нестабильный период для индустрии ИИ и мировых рынков программного обеспечения, когда инвесторы выражают обеспокоенность по поводу потенциального разрушения устоявшегося бизнеса корпоративного программного обеспечения, сообщает VentureBeat.

GPT-5.3-Codex, доступная через командную строку, расширение IDE, веб-интерфейс и новое настольное приложение macOS, превосходит своих предшественников по таким бенчмаркам, как SWE-Bench Pro и Terminal-Bench 2.0, сообщает Ars Technica. Хотя некоторые заголовки предполагали, что Codex построила себя сама, Ars Technica уточнила, что это преувеличение, подчеркнув, что модель предназначена для задач, аналогичных тем, которые используются фирмами, занимающимися разработкой корпоративного программного обеспечения, таких как управление развертываниями и отладка.

Claude Opus 4.6 от Anthropic, выпущенная в четверг, может похвастаться контекстным окном в 1 миллион токенов и "командами агентов", предназначенными для обработки более длительных автономных рабочих процессов. Компания утверждает, что она превосходит GPT-5.2 от OpenAI по ключевым корпоративным бенчмаркам, сообщает VentureBeat. Этот запуск напрямую бросает вызов Codex от OpenAI, которая также недавно выпустила настольное приложение.

В связанных новостях исследователи из Стэнфорда, Nvidia и Together AI разработали технику под названием Test-Time Training to Discover (TTT-Discover). Эта техника оптимизирует ядра GPU, достигая скорости в два раза выше, чем у экспертов-людей, сообщает VentureBeat. TTT-Discover позволяет моделям продолжать обучение в процессе вывода, обновляя веса для конкретной задачи.

AI-сообщество внимательно следит за прогрессом этих моделей. Выпуск новых передовых больших языковых моделей такими компаниями, как OpenAI и Anthropic, вызывает предвкушение, как подчеркивается на графике Model Evaluation & Threat Research (METR), который предполагает экспоненциальный рост определенных возможностей ИИ, сообщает MIT Technology Review. График играет важную роль в дискурсе об ИИ с момента его первоначального выпуска в марте прошлого года.