アリババの新しいQwen 3.5モデルが、VentureBeatによると、自社のフラッグシップモデルに対してベンチマークで勝利を収め、コストもわずかであることから、エンタープライズAIの状況に挑戦しています。このリリースは、旧正月に合わせて行われ、2026年のAIインフラを評価するITリーダーにとって重要な瞬間となります。同時に、AnthropicはClaude Sonnet 4.6をリリースし、ミッドティアのコストでフラッグシップに迫るインテリジェンスを提供し、Google DeepMindは大規模言語モデルの倫理的行動に対する監視の強化を求めています。
Qwen 3.5は、合計3970億個のパラメータを搭載していますが、トークンあたり170億個しかアクティブ化しません。VentureBeatの報道によると、アリババの以前のフラッグシップであるQwen3-Maxに対してベンチマークで勝利を収めています。Qwen3-Maxは、同社が1兆個を超えるパラメータを搭載していると認めています。これは、エンタープライズAIの購入者にとって魅力的な議論となり、実行、所有、制御できるモデルが、より高価なオプションと競合できることを示唆しています。
AnthropicのClaude Sonnet 4.6は、火曜日にリリースされ、ミッドティアのコストでフラッグシップに迫るインテリジェンスを提供することで、エンタープライズでの採用を加速させることを目指しています。このモデルは、ベータ版で100万トークンのコンテキストウィンドウを備えており、現在claude.aiおよびClaude Coworkのデフォルトモデルとなっています。VentureBeatによると、価格は前モデルのSonnet 4.5と同様に、100万トークンあたり315ドルで安定しています。「ミッドティアのコストでフラッグシップに迫るインテリジェンスを提供し、AIエージェントと自動化されたコーディングツールの展開に向けた前例のない企業のラッシュの真っただ中に位置しています」とVentureBeatは述べています。
これらの進歩は、業界が高リスクドメインでのAIの展開の複雑さと格闘している中で起こっています。例えば、LexisNexisは、VentureBeatの報道によると、精度、関連性、権威性、引用の正確性に対するニーズに対応するために、標準的な検索拡張生成(RAG)からグラフRAGおよびエージェントグラフへと進化しました。「特に法律などの複雑で高リスクなドメインでは、100%の精度や100%の関連性を得ることは決してないため、完璧なAIというものは存在しません」とVentureBeatは述べています。
一方、Google DeepMindは、大規模言語モデルの倫理的行動に対する監視の強化を提唱しています。LLMが向上し、コンパニオン、セラピスト、医療アドバイザーなど、よりデリケートな役割を担うようになるにつれて、Google DeepMindは、この技術が信頼できるものであることを保証したいと考えています。「コーディングや数学では、確認できる明確で正しい答えがあります」と、Google DeepMindの研究科学者であるWilliam Isaac氏はMIT Technology Reviewに語っています。
AI Experts & Community
Be the first to comment