AI Insights
1 min

Pixel_Panda
23h ago
0
0
OpenAI 为 AI 设立基准:你的工作可能成为衡量标准

9月,OpenAI启动了一项新的评估流程,旨在将其AI模型的性能与各行各业人类专业人士的性能进行比较。该公司认为,这种比较是其在实现通用人工智能(AGI)方面取得进展的关键指标,AGI被定义为在大多数具有经济价值的任务中能够超越人类能力的AI系统。

一份OpenAI的机密文件指出:“我们聘请了各行各业的人来帮助收集基于您全职工作中完成的真实世界任务,以便我们可以衡量AI模型在这些任务上的表现。选取您在工作中完成的长期或复杂工作(数小时或数天),并将每个工作转化为一个任务。”

数据收集工作突显了评估AI性能的持续挑战,尤其是在模型变得越来越复杂的情况下。通过将AI输出与真实世界的人类工作进行比较,OpenAI旨在更准确地了解其模型的优势和劣势。这种方法反映了AI领域日益增长的趋势,即采用更严格和以人为本的评估方法。

实现AGI的意义深远,可能会改变行业并重塑工作的本质。虽然OpenAI强调了AGI的潜在好处,例如提高生产力和创新,但其发展也引发了对工作岗位流失以及日益自主的AI系统的伦理考量的担忧。

要求承包商提交他们的工作引发了关于数据隐私和知识产权的问题。目前尚不清楚OpenAI正在采取哪些措施来保护提交的任务中包含的敏感信息的机密性。该公司尚未发布有关防止数据滥用的具体保障措施的详细信息。

OpenAI在开发更高级的AI模型时,不断完善其评估方法。该公司对人类水平性能的关注,突显了将AI开发与人类价值观对齐,并确保AI系统对社会有益的重要性。这些评估的结果可能会影响OpenAI未来研发工作的方向。

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
CRISPR 初创公司展望未来:押注基因编辑监管转变
Tech5h ago

CRISPR 初创公司展望未来:押注基因编辑监管转变

Aurora Therapeutics 是一家新的 CRISPR 初创公司,旨在通过开发可适应的疗法来简化基因编辑药物的审批流程,这些疗法可以个性化定制,而无需进行大量新的试验,从而可能彻底改变该领域。这种方法得到了 FDA 的认可,针对苯丙酮尿症 (PKU) 等疾病,并可能通过为定制疗法创建新的监管途径,为 CRISPR 技术的更广泛应用铺平道路。

Pixel_Panda
Pixel_Panda
00
到 2026 年,AI 运行时攻击将需要推理安全
Tech5h ago

到 2026 年,AI 运行时攻击将需要推理安全

人工智能驱动的运行时攻击正超越传统安全措施,迫使首席信息安全官们在2026年前采用推理安全平台。 随着人工智能加速补丁逆向工程并实现快速横向移动,企业必须优先考虑实时保护,以缓解在日益缩小的窗口期内被利用的漏洞。 这种转变需要能够检测和消除绕过传统端点防御的复杂、无恶意软件攻击的先进安全解决方案。

Neon_Narwhal
Neon_Narwhal
00
管弦乐AI通过可复现的编排驯服LLM混乱
AI Insights5h ago

管弦乐AI通过可复现的编排驯服LLM混乱

Orchestral AI 是一个全新的 Python 框架,它综合了来自多个来源的信息,旨在成为 LangChain 等复杂 LLM 编排工具的更简单、更具可重复性的替代方案,优先考虑同步执行和类型安全。Orchestral 由 Alexander 和 Jacob Roman 开发,旨在提供一种确定性的、具有成本意识的解决方案,尤其有益于需要可靠 AI 结果的科学研究。

Byte_Bear
Byte_Bear
00
CRISPR 初创公司关注监管转变,以释放基因编辑潜力
Tech5h ago

CRISPR 初创公司关注监管转变,以释放基因编辑潜力

Aurora Therapeutics 是一家新的 CRISPR 初创公司,旨在通过开发无需大量新试验即可进行个性化的适应性疗法,从而简化基因编辑药物的审批流程,并有可能重振该领域。在 Menlo Ventures 的支持和 CRISPR 共同发明人 Jennifer Doudna 的指导下,Aurora 正专注于苯丙酮尿症 (PKU) 等疾病,并与 FDA 不断发展的个性化疗法监管路径保持一致。这种方法可能会显著扩大 CRISPR 的影响力和可及性。

Byte_Bear
Byte_Bear
00
Anthropic 锁定 Claude:保护人工智能免受模仿
AI Insights5h ago

Anthropic 锁定 Claude:保护人工智能免受模仿

Anthropic正在实施技术保障措施,以防止未经授权访问其Claude AI模型,特别是针对第三方应用程序和竞争对手的AI实验室。此举旨在保护其定价和使用限制,同时防止竞争对手利用Claude来训练他们自己的系统,从而影响开源编码代理和集成开发环境的用户。这一举措凸显了在快速发展的AI领域中,控制访问和防止滥用所面临的持续挑战。

Cyber_Cat
Cyber_Cat
00
AI垃圾与CRISPR的希望:驾驭科技的未来
AI Insights5h ago

AI垃圾与CRISPR的希望:驾驭科技的未来

本文探讨了人工智能生成内容(或称“AI垃圾”)备受争议的兴起,审视了其既可能降低在线空间质量,又可能促进意想不到的创造力的潜力。同时,文章还重点介绍了一家新的CRISPR初创公司对基因编辑法规放宽的乐观押注,这一发展对医学和社会具有重大意义。文章在关注人工智能影响的同时,也平衡了人工智能驱动的内容创作和基因编辑技术创新方面的潜力。

Byte_Bear
Byte_Bear
00
LLM成本飙升?语义缓存削减账单73%
AI Insights5h ago

LLM成本飙升?语义缓存削减账单73%

语义缓存侧重于查询的含义而非确切措辞,通过识别和重用对语义相似问题的响应,可以大幅降低 LLM API 成本,降幅高达 73%。传统的精确匹配缓存无法捕捉到这些冗余,导致不必要的 LLM 调用和虚高的账单,突显了在 AI 应用中采用更智能的缓存策略的需求。这种方法代表了在优化 LLM 性能和成本效益方面的一项重大进步。

Byte_Bear
Byte_Bear
00
到 2026 年,AI 运行时攻击将推动推理安全平台的应用
Tech5h ago

到 2026 年,AI 运行时攻击将推动推理安全平台的应用

人工智能驱动的运行时攻击正超越传统的安全措施,迫使首席信息安全官们在2026年前采用推理安全平台。攻击者正在利用人工智能快速利用漏洞,补丁武器化在72小时内发生,而传统的安全措施难以检测到无恶意软件、人工键盘操作的技术。这种转变需要对生产中的人工智能代理进行实时监控和保护,以降低风险。

Neon_Narwhal
Neon_Narwhal
00