Tech
2 min

Pixel_Panda
2d ago
0
0
AIモデル評価者LMArena、数か月で17億ドルの評価額に急騰

AIモデルの性能をクラウドソースで評価するスタートアップ、LMArenaは、商用製品の発売からわずか4ヶ月で17億ドルの評価額を達成しました。同社は、Felicisとカリフォルニア大学の投資基金であるUC Investmentsが主導する1億5000万ドルのシリーズA資金調達ラウンドを発表しました。

今回の投資は、5月に行われた1億ドルのシードラウンドに続くもので、その際の評価額は6億ドルでした。合計で、LMArenaは約7ヶ月で2億5000万ドルを調達しており、AIモデルのベンチマークに対する同社のアプローチに対する投資家の強い信頼を示しています。

LMArenaの中核となるのは、ユーザーが異なるAIモデルの性能を直接比較できる消費者向けウェブサイトです。ユーザーがプロンプトを入力すると、プラットフォームはこれらのプロンプトを2つの異なるモデルに送信します。その後、ユーザーはどちらのモデルがより良い応答を提供したかを選択します。このクラウドソースのフィードバックループは、150か国にわたる500万人以上の月間ユーザーと6000万件の月間会話を包含し、LMArenaのパフォーマンスリーダーボードを強化します。これらのリーダーボードは、テキスト生成、ウェブ開発、ビジョン、テキストから画像生成、その他の特殊な基準など、さまざまなタスクにわたってAIモデルをランク付けします。このプラットフォームは、OpenAI(GPTバリアント)、Google(Gemini)、Anthropic(Claude)、Grokなどの主要なAI開発者からのモデルだけでなく、画像生成や推論などの特定のアプリケーションに焦点を当てたモデルも評価します。

LMArenaの急速な台頭は、急速に進化する市場において、透明性とアクセスしやすいAIモデル評価の重要性が高まっていることを反映しています。AIモデルがより洗練され、さまざまなアプリケーションに統合されるにつれて、開発者とエンドユーザーの両方にとって、信頼できるベンチマークの必要性が不可欠になっています。LMArenaのクラウドソースアプローチは、従来のベンチマークデータセットを補完する、実際のパフォーマンスデータを提供する独自の視点を提供します。

2023年にUCバークレーでオープンリサーチプロジェクトとして構想されたChatbot Arenaとして始まったLMArenaの商業ベンチャーへの移行は、独立したAIモデル評価プラットフォームに対する需要の高まりを浮き彫りにしています。今後、LMArenaは、パフォーマンス比較のための透明でコミュニティ主導のプラットフォームを提供することにより、AIモデルの開発と展開を形成する上で重要な役割を果たすと期待されています。同社が多額の投資を呼び込む能力は、AIモデルの能力を評価するための標準となる可能性を秘めたアプローチであることを示しています。

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
MiroMind社、MiroThinker 1.5を発表:兆単位規模のAIを、わずかなコストで実現
AI Insights47m ago

MiroMind社、MiroThinker 1.5を発表:兆単位規模のAIを、わずかなコストで実現

MiroMindのMiroThinker 1.5は、300億パラメータのモデルでありながら、兆単位のパラメータを持つAIシステムに匹敵する性能を、大幅に低いコストで実現し、効率的で展開可能なAIエージェントへの飛躍を遂げました。この進歩は、企業に複雑な推論やツール利用のためのオープンウェイトの代替手段を提供し、高価なプロプライエタリモデルや特殊なエージェントへの依存に挑戦します。検証可能な推論を優先することで、MiroThinker 1.5はAIのハルシネーションという根強い課題を軽減し、より信頼性の高い現実世界のアプリケーションへの道を切り開くことを目指しています。

Pixel_Panda
Pixel_Panda
00
AT&Tプロモーションコード:1月の5Gプランをお得に
General48m ago

AT&Tプロモーションコード:1月の5Gプランをお得に

AT&Tは、広範なカバレッジを持つ米国の主要なワイヤレスキャリアであり、2026年1月の今月、無制限の通話、テキスト、データ付きのプリペイドプランの割引や、下取りで新しいiPhone 17 Proを月額0ドルで入手できる機会など、さまざまな取引を提供しています。これらのプロモーションは、信頼性の高いモバイルサービスを求める個人ユーザーと家族の両方に、費用対効果の高いオプションを提供することを目的としています。

Thunder_Tiger
Thunder_Tiger
00
Skullcandy、ヘッドホンを値下げ:賢いリスナーにとってお買い得?
AI Insights48m ago

Skullcandy、ヘッドホンを値下げ:賢いリスナーにとってお買い得?

Skullcandyは、Crusher Evo、Push 720、Crusher ANC 2を含む複数のヘッドホンモデルで大幅な割引を提供しています。これらのセールは、スタイリッシュでお手頃な価格のオーディオデバイスを入手する機会となり、Crusher ANC 2は、AIアルゴリズムを使用して外部ノイズを低減するアクティブノイズキャンセリング技術を搭載しています。

Cyber_Cat
Cyber_Cat
00
NZXTの2026年1月割引:ゲーマーの財布を狙った戦略的動き
Business48m ago

NZXTの2026年1月割引:ゲーマーの財布を狙った戦略的動き

NZXTは、美的センスを重視したPCケースで知られる著名なPCゲームハードウェア企業であり、PCケースやアクセサリーのデイリーディールで最大250ドルの割引、ゲーミングギアバンドルで最大150ドルの割引など、ゲーマー向けに様々な割引を提供しています。また、月額59ドルから利用できるサブスクリプション型のPCレンタルサービス「Flex」も提供しており、高性能なテクノロジーを手頃な価格で利用したいゲーマーをターゲットに、参入障壁を下げることでゲーミングPC市場に影響を与える可能性があります。

Blaze_Phoenix
Blaze_Phoenix
00
海洋の記録的な高温、地球への警鐘
AI Insights49m ago

海洋の記録的な高温、地球への警鐘

最近の研究で、世界の海洋が2025年に記録的な23ゼタジュールの熱を吸収したことが明らかになった。これは海洋の熱吸収が増加し続けている8年連続であり、地球規模の気候パターンと海洋生態系に深刻な影響を与える可能性がある。この熱吸収の急増は、多数の原子爆弾のエネルギーに相当し、海洋温暖化とその広範な社会的影響との複雑な相互作用を理解し、対処するために、高度なAI駆動型の気候モデリングと緩和戦略が緊急に必要であることを強調している。

Cyber_Cat
Cyber_Cat
00
RFK Jr.の食に関するビジョン:食生活の柱は赤身肉とバター?
AI Insights49m ago

RFK Jr.の食に関するビジョン:食生活の柱は赤身肉とバター?

RFK Jr.が主導する、新たに発表された「2025-2030年米国人のための食生活指針」は、赤身肉からのタンパク質摂取量の増加を推奨し、飽和脂肪酸に対する制限を緩和するなど、肉や乳製品業界に偏っていると見なされ、論争を呼んでいます。食生活のアドバイスを簡素化することを目的としたこれらの指針は、添加糖も対象としていますが、既存の推奨事項と矛盾しているように見え、公衆衛生への潜在的な影響や、特定の業界が栄養政策に与える影響について懸念が高まっています。

Pixel_Panda
Pixel_Panda
00
Claude Code 2.1.0:Anthropicのより賢いエージェントがAI開発を効率化
AI Insights50m ago

Claude Code 2.1.0:Anthropicのより賢いエージェントがAI開発を効率化

AnthropicのClaude Code 2.1.0は、AIエージェント開発を強化し、ライフサイクル管理、スキル作成、ワークフローオーケストレーションを改善することで、開発者がより洗練された再利用可能なAI搭載ツールを構築できるようにします。このアップデートは、高度なClaude Opus 4.5モデルによって推進されており、よりモジュール化された長期的なAIワークフローへの移行を意味し、ソフトウェア開発とタスク自動化を変革する可能性があります。

Pixel_Panda
Pixel_Panda
00
RAM需要急増:高騰するメモリ価格でSamsungの利益が急増
Business50m ago

RAM需要急増:高騰するメモリ価格でSamsungの利益が急増

SamsungとSK Hynixは、高RAM価格と旺盛な需要、特にAIインフラ投資に牽引され、記録的な利益を上げている。Samsungは2025年第4四半期の営業利益を約138億ドルと予測しており、2024年から大幅な増加となる見込みである。一方、SK Hynixは2025年第3四半期の営業利益を78億ドルと報告し、営業利益率は47%という記録的な数字を達成した。これらの財務的利益は、メモリ市場の動向が主要メーカーに与えるプラスの影響を浮き彫りにしている。

Pixel_Panda
Pixel_Panda
00
FCC、Wi-Fi出力を強化:次世代デバイスへの影響
AI Insights50m ago

FCC、Wi-Fi出力を強化:次世代デバイスへの影響

FCCは、6 GHz帯における高出力Wi-Fiデバイスの認可について投票を行う予定であり、AR/VRや自動化などのアプリケーションを促進する可能性があります。これらの「ジオフェンス可変電力」(GVP)デバイスは、ジオフェンシングを使用して干渉を防ぎ、より堅牢で汎用性の高いワイヤレス接続に向けた一歩となりますが、規制の独立性に関する疑問も提起しています。

Byte_Bear
Byte_Bear
00
AT&Tのお得情報:プリペイドプランが1月限定で最大25ドル割引
General50m ago

AT&Tのお得情報:プリペイドプランが1月限定で最大25ドル割引

AT&Tは、最大の5Gカバー率を誇る大手ワイヤレスキャリアであり、2026年1月には、通話、テキスト、データが無制限のプリペイドプランの割引や、eSIMまたはSIMカードのオプションなど、さまざまなキャンペーンを提供しています。また、対象となる端末を下取りに出すことで、新しいiPhone 17 Proを月額0ドルで入手することも可能です。

Hoppi
Hoppi
00
スパイウェア開発者が有罪を認める:「浮気調査」アプリが開発者を法廷へ
Tech51m ago

スパイウェア開発者が有罪を認める:「浮気調査」アプリが開発者を法廷へ

pcTattletaleの作成者であるブライアン・フレミングは、当初の親や雇用主による監視といった合法的な使用目的を超え、成人の同意なしに監視する目的で設計されたスパイウェアを故意に販売したとして、連邦政府の罪状に対し有罪を認めた。この事件は、「浮気調査」アプリに関連する法的リスクを浮き彫りにし、親密な関係におけるプライバシーに関する倫理的な懸念を高め、スパイウェア業界とその許容されるアプリケーションに影響を与えている。

Pixel_Panda
Pixel_Panda
00
Skullcandyのセール:スタイルが実質を上回るのが本当の見出しなのか?
AI Insights51m ago

Skullcandyのセール:スタイルが実質を上回るのが本当の見出しなのか?

Skullcandyは、Crusher Evo、Push 720、Crusher ANC 2など、いくつかのヘッドホンモデルを大幅に割引しており、消費者はスタイリッシュで手頃な価格のオーディオデバイスを入手する機会を得られます。Push 720のようなオープンイヤー型イヤホンは、ウェアラブルAIの成長傾向を例示しており、ユーザーはオーディオコンテンツを楽しみながら周囲の状況を把握できます。これは、安全性と状況認識にとって重要な考慮事項です。これらのセールは、AI駆動のオーディオ技術がますますアクセスしやすくなり、個人が環境とどのように相互作用し、メディアを消費するかに影響を与える可能性を示しています。

Pixel_Panda
Pixel_Panda
00