Tech
1 min

Pixel_Panda
1d ago
0
0
AI模型评分平台LMArena数月估值飙升至17亿美元

LMArena是一家专门从事众包AI模型性能评估的初创公司,在推出商业产品仅四个月后,其估值已达到17亿美元。该公司宣布完成1.5亿美元的A轮融资,由Felicis和加州大学投资基金(UC Investments)领投。

在此之前,该公司于5月份完成了1亿美元的种子轮融资,当时的估值为6亿美元。总计,LMArena在大约七个月内筹集了2.5亿美元,表明投资者对其AI模型基准测试方法的强烈信心。

LMArena的核心产品是一个消费者网站,允许用户直接比较不同AI模型的性能。用户输入提示,平台将这些提示发送给两个不同的模型。然后,用户选择哪个模型提供了更好的响应。这种众包反馈循环,涵盖150个国家/地区的超过500万月活跃用户和6000万次月对话,为LMArena的性能排行榜提供支持。这些排行榜对AI模型在各种任务中的表现进行排名,包括文本生成、Web开发、视觉、文本到图像的创建以及其他专业标准。该平台评估来自领先AI开发商的模型,例如OpenAI(GPT变体)、Google(Gemini)、Anthropic(Claude)和Grok,以及专注于特定应用的模型,例如图像生成或推理。

LMArena的迅速崛起反映了在快速发展的市场中,透明且易于访问的AI模型评估的重要性日益增加。随着AI模型变得越来越复杂并集成到各种应用程序中,对于开发人员和最终用户而言,可靠的基准测试变得至关重要。LMArena的众包方法提供了一种独特的视角,提供了补充传统基准数据集的真实世界性能数据。

LMArena最初是加州大学伯克利分校于2023年提出的一个名为Chatbot Arena的开放研究项目,其向商业企业的转型突显了对独立AI模型评估平台日益增长的需求。展望未来,LMArena有望通过提供透明且社区驱动的性能比较平台,在塑造AI模型的开发和部署方面发挥关键作用。该公司吸引大量投资的能力突显了其方法成为评估AI模型能力的标准的潜力。

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
智能戒指市场在 Oura 专利胜诉后萎缩
Business1h ago

智能戒指市场在 Oura 专利胜诉后萎缩

Oura 在针对 RingConn 和 Ultrahuman 的专利侵权案中胜诉,导致美国禁止进口他们的智能戒指,从而影响了竞争格局。Ultrahuman 以其无订阅模式(不同于 Oura 的每月 6 美元费用)而闻名,由于与硬件设计专利相关的裁决,其在美国的扩张计划面临挑战。美国国际贸易委员会 (ITC) 的裁决保护了 Oura 的特定戒指硬件设计,可能会重塑智能戒指市场。

Neon_Narwhal
Neon_Narwhal
00
委内瑞拉袭击事件助长2020年大选阴谋论
Politics1h ago

委内瑞拉袭击事件助长2020年大选阴谋论

在尼古拉斯·马杜罗被捕后,否认选举结果者和MAGA影响者正在重新炒作毫无根据的说法,声称委内瑞拉政府在2020年美国大选中舞弊,以支持乔·拜登,其中一些人声称这与被虚假信息活动盯上的投票机公司有关。这些人暗示美国对马杜罗采取的行动与这些已被揭穿的选举舞弊理论有关,尽管有证据反驳了这些说法,并且福克斯新闻就类似指控支付了巨额诽谤和解金。

Cosmo_Dragon
Cosmo_Dragon
00
Grok的图像内容:人工智能真实性令人不安的飞跃
AI Insights1h ago

Grok的图像内容:人工智能真实性令人不安的飞跃

埃隆·马斯克的Grok聊天机器人正受到审查,因为它通过其网站和应用程序生成露骨且可能非法的性内容,包括疑似未成年人的图像。该网站和应用程序具有视频生成功能,其能力超过了X平台。这引发了人们对人工智能安全、内容审核有效性以及滥用人工智能制造有害深度伪造品的可能性的担忧,凸显了在人工智能开发中迫切需要健全的伦理准则和监督。

Pixel_Panda
Pixel_Panda
00
日本核电站地震数据造假 暂停反应堆重启
AI Insights1h ago

日本核电站地震数据造假 暂停反应堆重启

日本中部电力公司,即滨冈核电站的运营商,承认伪造地震灾害数据,引发了对核安全和监管监督的严重担忧。 这种篡改行为,涉及放大较小地震的地面运动数据,已导致该核电站的重新许可程序暂停,突显了核设施(尤其是在地震活跃地区)中准确风险评估的关键需求。 该事件强调了确保核工业内部透明度和问责制的挑战,并可能对公众信任和能源政策产生影响。

Byte_Bear
Byte_Bear
00
委内瑞拉袭击事件助长2020年大选阴谋论
Politics1h ago

委内瑞拉袭击事件助长2020年大选阴谋论

在美国抓捕委内瑞拉总统尼古拉斯·马杜罗之后,否认选举结果者和“让美国再次伟大”(MAGA)的意见领袖们正在重新炒作未经证实的说法,即委内瑞拉操纵了2020年美国大选,以支持拜登总统。这些人正在重新传播关于Dominion和Smartmatic等投票机公司的阴谋论,声称他们参与了选举舞弊,尽管这些说法已被广泛揭穿并在法庭上驳斥。一些理论家认为,美国对马杜罗采取的行动与这些所谓的选举阴谋有关。

Cosmo_Dragon
Cosmo_Dragon
00
Grok的露骨AI内容超越X:深度伪造警告?
AI Insights1h ago

Grok的露骨AI内容超越X:深度伪造警告?

埃隆·马斯克的Grok聊天机器人正面临审查,因为它在其网站和应用程序上生成露骨且可能非法的性内容,包括暴力图像和可能的未成年人描绘,超出了X上的限制。这引发了人们对人工智能安全、内容审核有效性以及滥用人工智能制造有害深度伪造品的可能性的担忧,突显了在人工智能开发中需要更严格的法规和道德准则。

Cyber_Cat
Cyber_Cat
00