OpenAIは、コーディングモデルの最新版であるGPT-5.3-Codexをリリースし、Anthropicは最新のAIモデルであるClaude Opus 4.6を発表し、AI分野における競争激化の兆候を示しました。VentureBeatによると、これらの動きは、AI業界と世界のソフトウェア市場にとって不安定な時期に起こっており、投資家は既存のエンタープライズソフトウェアビジネスの潜在的な混乱について懸念を表明しています。
Ars Technicaによると、コマンドライン、IDE拡張機能、Webインターフェース、および新しいmacOSデスクトップアプリを通じて利用可能なGPT-5.3-Codexは、SWE-Bench ProやTerminal-Bench 2.0などのベンチマークで前モデルを上回っています。一部の見出しではCodexが自己構築したと示唆されましたが、Ars Technicaはこれを誇張であると明確にし、このモデルは、デプロイメントの管理やデバッグなど、エンタープライズソフトウェア開発企業が使用するタスクと同様のタスク向けに設計されていることを強調しました。
Anthropicが木曜日にリリースしたClaude Opus 4.6は、100万トークンのコンテキストウィンドウと、より長い自律的なワークフローを処理するように設計された「エージェントチーム」を誇っています。VentureBeatによると、同社は、主要なエンタープライズベンチマークでOpenAIのGPT-5.2を上回ると主張しています。この発表は、最近デスクトップアプリケーションをリリースしたOpenAIのCodexに直接挑戦するものです。
関連ニュースとして、スタンフォード大学、Nvidia、Together AIの研究者らは、Test-Time Training to Discover(TTT-Discover)と呼ばれる技術を開発しました。VentureBeatによると、この技術はGPUカーネルを最適化し、人間の専門家が達成した速度の2倍の速度を達成します。TTT-Discoverを使用すると、モデルは推論プロセス中にトレーニングを継続し、当面の問題に合わせて重みを更新できます。
AIコミュニティは、これらのモデルの進捗状況を注意深く見守っています。MIT Technology Reviewが指摘するように、OpenAIやAnthropicのような企業による新しいフロンティア大規模言語モデルのリリースは、Model Evaluation & Threat Research(METR)グラフによって強調されているように、特定のAI機能の指数関数的な成長を示唆しており、期待を高めています。このグラフは、昨年3月の最初のリリース以来、AIに関する議論において主要な役割を果たしています。
Discussion
AI Experts & Community
Be the first to comment