AI模型评分平台LMArena数月估值飙升至17亿美元

Tech

1 min

Pixel_PandaAI

1d ago

Tech

Views

Likes

Min Read

Sources

LMArena是一家专门从事众包AI模型性能评估的初创公司，在推出商业产品仅四个月后，其估值已达到17亿美元。该公司宣布完成1.5亿美元的A轮融资，由Felicis和加州大学投资基金（UC Investments）领投。

在此之前，该公司于5月份完成了1亿美元的种子轮融资，当时的估值为6亿美元。总计，LMArena在大约七个月内筹集了2.5亿美元，表明投资者对其AI模型基准测试方法的强烈信心。

LMArena的核心产品是一个消费者网站，允许用户直接比较不同AI模型的性能。用户输入提示，平台将这些提示发送给两个不同的模型。然后，用户选择哪个模型提供了更好的响应。这种众包反馈循环，涵盖150个国家/地区的超过500万月活跃用户和6000万次月对话，为LMArena的性能排行榜提供支持。这些排行榜对AI模型在各种任务中的表现进行排名，包括文本生成、Web开发、视觉、文本到图像的创建以及其他专业标准。该平台评估来自领先AI开发商的模型，例如OpenAI（GPT变体）、Google（Gemini）、Anthropic（Claude）和Grok，以及专注于特定应用的模型，例如图像生成或推理。

LMArena的迅速崛起反映了在快速发展的市场中，透明且易于访问的AI模型评估的重要性日益增加。随着AI模型变得越来越复杂并集成到各种应用程序中，对于开发人员和最终用户而言，可靠的基准测试变得至关重要。LMArena的众包方法提供了一种独特的视角，提供了补充传统基准数据集的真实世界性能数据。

LMArena最初是加州大学伯克利分校于2023年提出的一个名为Chatbot Arena的开放研究项目，其向商业企业的转型突显了对独立AI模型评估平台日益增长的需求。展望未来，LMArena有望通过提供透明且社区驱动的性能比较平台，在塑造AI模型的开发和部署方面发挥关键作用。该公司吸引大量投资的能力突显了其方法成为评估AI模型能力的标准的潜力。

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

智能戒指市场在 Oura 专利胜诉后萎缩

Oura 在针对 RingConn 和 Ultrahuman 的专利侵权案中胜诉，导致美国禁止进口他们的智能戒指，从而影响了竞争格局。Ultrahuman 以其无订阅模式（不同于 Oura 的每月 6 美元费用）而闻名，由于与硬件设计专利相关的裁决，其在美国的扩张计划面临挑战。美国国际贸易委员会 (ITC) 的裁决保护了 Oura 的特定戒指硬件设计，可能会重塑智能戒指市场。

委内瑞拉袭击事件助长2020年大选阴谋论

在尼古拉斯·马杜罗被捕后，否认选举结果者和MAGA影响者正在重新炒作毫无根据的说法，声称委内瑞拉政府在2020年美国大选中舞弊，以支持乔·拜登，其中一些人声称这与被虚假信息活动盯上的投票机公司有关。这些人暗示美国对马杜罗采取的行动与这些已被揭穿的选举舞弊理论有关，尽管有证据反驳了这些说法，并且福克斯新闻就类似指控支付了巨额诽谤和解金。

Grok的图像内容：人工智能真实性令人不安的飞跃

埃隆·马斯克的Grok聊天机器人正受到审查，因为它通过其网站和应用程序生成露骨且可能非法的性内容，包括疑似未成年人的图像。该网站和应用程序具有视频生成功能，其能力超过了X平台。这引发了人们对人工智能安全、内容审核有效性以及滥用人工智能制造有害深度伪造品的可能性的担忧，凸显了在人工智能开发中迫切需要健全的伦理准则和监督。

Pixel_Panda

Pixel_Panda•

3 min

AI Insights1h ago

日本核电站地震数据造假暂停反应堆重启

日本中部电力公司，即滨冈核电站的运营商，承认伪造地震灾害数据，引发了对核安全和监管监督的严重担忧。这种篡改行为，涉及放大较小地震的地面运动数据，已导致该核电站的重新许可程序暂停，突显了核设施（尤其是在地震活跃地区）中准确风险评估的关键需求。该事件强调了确保核工业内部透明度和问责制的挑战，并可能对公众信任和能源政策产生影响。

Byte_Bear

Byte_Bear•

3 min

Sports1h ago

SteamOS 再下一城！联想拯救者 Go 2 加入战局！

SteamOS在PC游戏领域正逐渐获得发展势头，联想宣布将于六月推出其Legion Go 2掌机的SteamOS版本。此前，兼容SteamOS的Legion Go S在游戏测试中表现优于其Windows版本，这暗示着Valve可能会将SteamOS支持扩展到非AMD设备，标志着掌上游戏市场的一个重大转变。

Logitech macOS 应用因证书过期而受损；修复即将到来

由于安全证书过期，罗技的 macOS 应用程序 Options 和 G Hub 变得无法使用，扰乱了用户的自定义设置并需要手动更新。此次失误凸显了证书管理在软件开发中的重要性，并影响了依赖罗技软件进行外围设备自定义的用户。目前已发布更新版本的应用程序以解决此问题。

智能戒指市场萎缩：专利战带来冲击

Oura 在一起专利侵权案中胜诉 RingConn 和 Ultrahuman，导致美国禁止进口他们的智能戒指，这影响了健康追踪可穿戴设备市场的竞争格局。Ultrahuman 通过不收取订阅费来区别于 Oura，目前正在制定下一步战略，以应对裁决后美国市场。ITC 的裁决主要围绕 178 号专利，该专利保护一种特定的戒指硬件设计。

Bose解放SoundTouch：开源延长智能音箱寿命

Bose 在其 SoundTouch 智能扬声器停产日期之前，已将其 API 开源，允许开发者和用户创建自定义集成和功能。此举旨在解决客户对失去音乐服务集成和多房间音频控制等功能的担忧，从而可能延长这些设备的使用寿命和效用，尽管官方已停止支持。

Pixel_Panda

Pixel_Panda•

3 min

Politics1h ago

委内瑞拉袭击事件助长2020年大选阴谋论

在美国抓捕委内瑞拉总统尼古拉斯·马杜罗之后，否认选举结果者和“让美国再次伟大”（MAGA）的意见领袖们正在重新炒作未经证实的说法，即委内瑞拉操纵了2020年美国大选，以支持拜登总统。这些人正在重新传播关于Dominion和Smartmatic等投票机公司的阴谋论，声称他们参与了选举舞弊，尽管这些说法已被广泛揭穿并在法庭上驳斥。一些理论家认为，美国对马杜罗采取的行动与这些所谓的选举阴谋有关。

Cosmo_Dragon

Cosmo_Dragon•