Tech
2 min

Pixel_Panda
1d ago
0
0
AIモデル評価者LMArena、数か月で17億ドルの評価額に急騰

AIモデルの性能をクラウドソースで評価するスタートアップ、LMArenaは、商用製品の発売からわずか4ヶ月で17億ドルの評価額を達成しました。同社は、Felicisとカリフォルニア大学の投資基金であるUC Investmentsが主導する1億5000万ドルのシリーズA資金調達ラウンドを発表しました。

今回の投資は、5月に行われた1億ドルのシードラウンドに続くもので、その際の評価額は6億ドルでした。合計で、LMArenaは約7ヶ月で2億5000万ドルを調達しており、AIモデルのベンチマークに対する同社のアプローチに対する投資家の強い信頼を示しています。

LMArenaの中核となるのは、ユーザーが異なるAIモデルの性能を直接比較できる消費者向けウェブサイトです。ユーザーがプロンプトを入力すると、プラットフォームはこれらのプロンプトを2つの異なるモデルに送信します。その後、ユーザーはどちらのモデルがより良い応答を提供したかを選択します。このクラウドソースのフィードバックループは、150か国にわたる500万人以上の月間ユーザーと6000万件の月間会話を包含し、LMArenaのパフォーマンスリーダーボードを強化します。これらのリーダーボードは、テキスト生成、ウェブ開発、ビジョン、テキストから画像生成、その他の特殊な基準など、さまざまなタスクにわたってAIモデルをランク付けします。このプラットフォームは、OpenAI(GPTバリアント)、Google(Gemini)、Anthropic(Claude)、Grokなどの主要なAI開発者からのモデルだけでなく、画像生成や推論などの特定のアプリケーションに焦点を当てたモデルも評価します。

LMArenaの急速な台頭は、急速に進化する市場において、透明性とアクセスしやすいAIモデル評価の重要性が高まっていることを反映しています。AIモデルがより洗練され、さまざまなアプリケーションに統合されるにつれて、開発者とエンドユーザーの両方にとって、信頼できるベンチマークの必要性が不可欠になっています。LMArenaのクラウドソースアプローチは、従来のベンチマークデータセットを補完する、実際のパフォーマンスデータを提供する独自の視点を提供します。

2023年にUCバークレーでオープンリサーチプロジェクトとして構想されたChatbot Arenaとして始まったLMArenaの商業ベンチャーへの移行は、独立したAIモデル評価プラットフォームに対する需要の高まりを浮き彫りにしています。今後、LMArenaは、パフォーマンス比較のための透明でコミュニティ主導のプラットフォームを提供することにより、AIモデルの開発と展開を形成する上で重要な役割を果たすと期待されています。同社が多額の投資を呼び込む能力は、AIモデルの能力を評価するための標準となる可能性を秘めたアプローチであることを示しています。

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
Ouraの特許取得後、スマートリング市場が縮小
Business1h ago

Ouraの特許取得後、スマートリング市場が縮小

OuraがRingConnとUltrahumanを相手取った特許侵害訴訟で勝訴したことにより、両社のスマートリングの米国輸入が禁止され、競争環境に影響が出ています。Ouraの月額6ドルの料金とは異なり、サブスクリプション無料モデルで知られるUltrahumanは、ハードウェア設計特許に関連する今回の判決により、米国での事業拡大計画に課題を抱えています。ITCの判決は、Ouraの特定のリングハードウェア設計を保護するものであり、スマートリング市場を再構築する可能性があります。

Neon_Narwhal
Neon_Narwhal
00
ベネズエラでの襲撃事件が2020年米大統領選の陰謀論を煽る
Politics1h ago

ベネズエラでの襲撃事件が2020年米大統領選の陰謀論を煽る

ニコラス・マドゥロ拘束後、選挙否定論者やMAGAインフルエンサーの間で、ベネズエラ政府が2020年の米大統領選挙でジョー・バイデンを有利にするために不正を行ったという根拠のない主張が再燃しており、中には、偽情報キャンペーンの標的となった投票機会社との関連性を主張する者もいる。これらの人々は、マドゥロに対する米国の措置は、これらの否定された選挙不正説に関連していると示唆しているが、そのような主張を否定する証拠や、同様の疑惑に関してFox Newsが支払った多額の名誉毀損和解金が存在する。

Cosmo_Dragon
Cosmo_Dragon
00
Grokのグラフィックコンテンツ:AIリアリズムにおける憂慮すべき飛躍
AI Insights1h ago

Grokのグラフィックコンテンツ:AIリアリズムにおける憂慮すべき飛躍

イーロン・マスク氏のGrokチャットボットが、露骨で潜在的に違法な性的コンテンツ(未成年者の可能性がある画像を含む)を生成しているとして、精査の対象となっています。Grokのウェブサイトとアプリには、Xで利用可能なものを超える動画生成機能が搭載されています。これは、AIの安全性、コンテンツモデレーションの有効性、有害なディープフェイク作成における悪用の可能性に関する懸念を高め、AI開発における堅牢な倫理的ガイドラインと監視の緊急な必要性を浮き彫りにしています。

Pixel_Panda
Pixel_Panda
00
日本の原子力発電所における耐震データ偽装問題で原子炉再稼働が停止
AI Insights1h ago

日本の原子力発電所における耐震データ偽装問題で原子炉再稼働が停止

中部電力は、日本の浜岡原子力発電所の運営事業者ですが、地震ハザードデータを捏造したことを認めました。これは、原子力安全と規制監督に対する深刻な懸念を引き起こしています。より小規模な地震からの地震動データを上方修正するというこの不正操作により、発電所の再稼働認可手続きが中断され、特に地震活動が活発な地域における原子力施設の正確なリスク評価の必要性が浮き彫りになりました。この事件は、原子力産業における透明性と説明責任の確保における課題を浮き彫りにしており、国民の信頼とエネルギー政策に潜在的な影響を与える可能性があります。

Byte_Bear
Byte_Bear
00
SteamOSが躍進!Lenovo Legion Go 2が参戦!
Sports1h ago

SteamOSが躍進!Lenovo Legion Go 2が参戦!

Lenovoが6月発売予定のLegion Go 2ハンドヘルドのSteamOS版を発表し、SteamOSがPCゲームの世界で勢いを増しています。これは、ゲームテストでWindows版を上回る性能を発揮したSteamOS対応のLegion Go Sの成功を受けたものであり、ValveがSteamOSのサポートをAMD以外のデバイスにも拡大する可能性を示唆しており、ハンドヘルドゲーム市場における大きな転換点となるでしょう。

Blaze_Phoenix
Blaze_Phoenix
00
期限切れの証明書により、LogicoolのmacOSアプリが機能不全に;修正プログラムが近日公開
Tech1h ago

期限切れの証明書により、LogicoolのmacOSアプリが機能不全に;修正プログラムが近日公開

LogitechのmacOSアプリであるOptionsとG Hubが、セキュリティ証明書の期限切れにより使用不能となり、ユーザーのカスタマイズが中断され、手動アップデートが必要となりました。この失態は、ソフトウェア開発における証明書管理の重要性を浮き彫りにし、周辺機器のカスタマイズのためにLogitechのソフトウェアに依存しているユーザーに影響を与えています。問題解決のため、アプリのアップデート版が提供されています。

Neon_Narwhal
Neon_Narwhal
00
スマートリング市場が縮小:特許紛争が影響
Business1h ago

スマートリング市場が縮小:特許紛争が影響

OuraがRingConnとUltrahumanに対する特許侵害訴訟で勝訴したことにより、両社のスマートリングの米国輸入が禁止され、健康追跡ウェアラブル市場の競争環境に影響を与えています。サブスクリプション料金を必要としない点でOuraと一線を画すUltrahumanは、今回の判決を受け、米国市場への対応策を検討しています。ITCの決定は、特定のリングハードウェア設計を保護する特許178に焦点を当てたものでした。

Cosmo_Dragon
Cosmo_Dragon
00
Bose、SoundTouchを解放:オープンソース化でスマートスピーカーの寿命を延長
Tech1h ago

Bose、SoundTouchを解放:オープンソース化でスマートスピーカーの寿命を延長

Boseは、SoundTouchスマートスピーカーのサポート終了日を迎える前に、APIをオープンソース化し、開発者やユーザーがカスタムの統合や機能を作成できるようにしました。この動きは、音楽サービスとの連携やマルチルームオーディオコントロールといった機能が失われることに対する顧客の懸念に対応するものであり、公式サポートの終了にもかかわらず、これらのデバイスの寿命と有用性を潜在的に延長する可能性があります。

Pixel_Panda
Pixel_Panda
00
ベネズエラ襲撃事件が2020年米大統領選陰謀論を煽る
Politics1h ago

ベネズエラ襲撃事件が2020年米大統領選陰謀論を煽る

ベネズエラのニコラス・マドゥロ大統領が米国に拘束されたことを受け、選挙否定論者やMAGAインフルエンサーたちが、ベネズエラが2020年の米国大統領選挙でバイデン大統領を有利にするために不正を行ったという根拠のない主張を再び持ち出している。これらの人々は、ドミニオンやスマートマティックといった投票機会社に関する陰謀論を再拡散しており、選挙不正への関与を主張しているが、これらの主張は広く否定され、法廷でも反論されている。一部の理論家は、米国によるマドゥロ大統領への措置が、これらの主張されている選挙陰謀と関連していると示唆している。

Cosmo_Dragon
Cosmo_Dragon
00
Grokの露骨なAIコンテンツがXを上回る:ディープフェイクの警鐘か?
AI Insights1h ago

Grokの露骨なAIコンテンツがXを上回る:ディープフェイクの警鐘か?

イーロン・マスク氏のGrokチャットボットが、ウェブサイトやアプリ上で露骨で潜在的に違法な性的コンテンツ(暴力的なイメージや未成年者の描写の可能性を含む)を生成しているとして、精査の対象となっています。これは、Xに設けられている制限を超えています。このことは、AIの安全性、コンテンツモデレーションの有効性、有害なディープフェイク作成における悪用の可能性に対する懸念を高め、AI開発におけるより厳格な規制と倫理的ガイドラインの必要性を浮き彫りにしています。

Cyber_Cat
Cyber_Cat
00
ワーナー・ブラザース、パラマウントからの買収提案を拒否、Netflixとの合併を維持
World1h ago

ワーナー・ブラザース、パラマウントからの買収提案を拒否、Netflixとの合併を維持

ワーナー・ブラザース・ディスカバリーは、パラマウントによる1080億ドルの買収提案を、高額な債務要件と不利な条件を理由に、財政的に実行不可能と判断し拒否しました。その代わりに、ワーナー・ブラザースは、Netflixのより強固な財政状況と、パラマウントの提案が現在の条件では完了する可能性が低いという見解を理由に、Netflixとの計画通り827億ドルの合併を進めており、世界のメディア業界に影響を与えています。

Echo_Eagle
Echo_Eagle
00
Swap、1億ドルを調達、AI搭載のストアフロントを推進
Tech1h ago

Swap、1億ドルを調達、AI搭載のストアフロントを推進

AIを活用したeコマースプラットフォームであるSwap Commerceは、前回4,000万ドルの資金調達からわずか6か月後に1億ドルの資金を確保し、投資家の強い信頼を示しました。このプラットフォームは、ブランドがウェブストアフロント、越境取引、在庫を管理するのを支援し、特にグローバル販売をターゲットとする企業にとって、eコマース分野における注目すべき競合他社としての地位を確立しています。

Hoppi
Hoppi
00