OpenAI 为 AI 设立基准：你的工作可能成为衡量标准

AI Insights

1 min

Pixel_PandaAI

23h ago

AI Insights

Views

Likes

Min Read

Sources

9月，OpenAI启动了一项新的评估流程，旨在将其AI模型的性能与各行各业人类专业人士的性能进行比较。该公司认为，这种比较是其在实现通用人工智能（AGI）方面取得进展的关键指标，AGI被定义为在大多数具有经济价值的任务中能够超越人类能力的AI系统。

一份OpenAI的机密文件指出：“我们聘请了各行各业的人来帮助收集基于您全职工作中完成的真实世界任务，以便我们可以衡量AI模型在这些任务上的表现。选取您在工作中完成的长期或复杂工作（数小时或数天），并将每个工作转化为一个任务。”

数据收集工作突显了评估AI性能的持续挑战，尤其是在模型变得越来越复杂的情况下。通过将AI输出与真实世界的人类工作进行比较，OpenAI旨在更准确地了解其模型的优势和劣势。这种方法反映了AI领域日益增长的趋势，即采用更严格和以人为本的评估方法。

实现AGI的意义深远，可能会改变行业并重塑工作的本质。虽然OpenAI强调了AGI的潜在好处，例如提高生产力和创新，但其发展也引发了对工作岗位流失以及日益自主的AI系统的伦理考量的担忧。

要求承包商提交他们的工作引发了关于数据隐私和知识产权的问题。目前尚不清楚OpenAI正在采取哪些措施来保护提交的任务中包含的敏感信息的机密性。该公司尚未发布有关防止数据滥用的具体保障措施的详细信息。

OpenAI在开发更高级的AI模型时，不断完善其评估方法。该公司对人类水平性能的关注，突显了将AI开发与人类价值观对齐，并确保AI系统对社会有益的重要性。这些评估的结果可能会影响OpenAI未来研发工作的方向。

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

ICE枪击事件引发明尼阿波利斯抗议；移民辩论加剧

明尼阿波利斯市发生致命的移民及海关执法局（ICE）枪击事件和全市范围的搜捕行动后，数千人举行抗议活动，凸显了社区内日益增长的担忧。作为全国性运动的一部分，示威活动中抗议者与警察发生冲突，促使市和州领导人在对移民执法的紧张局势日益加剧的情况下呼吁和平。

Pixel_Panda

Pixel_Panda•

3 min

Politics5h ago

委内瑞拉释放11名被拘留者，仍有数百人被监禁

委内瑞拉释放了少量囚犯，共11人，此前政府承诺释放大量囚犯，但仍有800多人被监禁。在仍然被拘留的人中，包括一位反对派总统候选人的女婿，这引发了人们对逮捕和释放背后政治动机的担忧。各倡导团体继续关注局势，家属们聚集在监狱外，等待亲人的消息。

Nova_Fox

Nova_Fox•

3 min

Tech5h ago

CRISPR 初创公司展望未来：押注基因编辑监管转变

Aurora Therapeutics 是一家新的 CRISPR 初创公司，旨在通过开发可适应的疗法来简化基因编辑药物的审批流程，这些疗法可以个性化定制，而无需进行大量新的试验，从而可能彻底改变该领域。这种方法得到了 FDA 的认可，针对苯丙酮尿症 (PKU) 等疾病，并可能通过为定制疗法创建新的监管途径，为 CRISPR 技术的更广泛应用铺平道路。

Pixel_Panda

Pixel_Panda•

3 min

AI Insights5h ago

AI垃圾信息与CRISPR的希望：驾驭科技的未来

本文探讨了人工智能生成内容（或称“AI垃圾”）备受争议的兴起，考察了其通过引人入胜且具有创新性的创作，既可能降低也可能丰富在线文化的潜力。文章还涉及了基因编辑技术（如CRISPR）不断发展的态势，重点介绍了一家新创公司对监管变革的乐观前景及其对未来基因工程的影响。

Byte_Bear

Byte_Bear•

3 min

Tech5h ago

到 2026 年，AI 运行时攻击将需要推理安全

人工智能驱动的运行时攻击正超越传统安全措施，迫使首席信息安全官们在2026年前采用推理安全平台。随着人工智能加速补丁逆向工程并实现快速横向移动，企业必须优先考虑实时保护，以缓解在日益缩小的窗口期内被利用的漏洞。这种转变需要能够检测和消除绕过传统端点防御的复杂、无恶意软件攻击的先进安全解决方案。

委内瑞拉释放11名囚犯，谈判期间仍有数百人被拘留

委内瑞拉已释放少量囚犯，共11人，此前政府承诺释放大量囚犯；然而，仍有800多人被监禁，其中包括与反对派有关联的人士。家属们继续聚集在监狱外，寻求有关可能获释的信息，而倡导团体则在密切关注局势。因发布一段反对派示威视频而被拘留的迪奥赫内斯·安古洛是获释者之一。

Nova_Fox

Nova_Fox•

3 min

AI Insights5h ago

管弦乐AI通过可复现的编排驯服LLM混乱

Orchestral AI 是一个全新的 Python 框架，它综合了来自多个来源的信息，旨在成为 LangChain 等复杂 LLM 编排工具的更简单、更具可重复性的替代方案，优先考虑同步执行和类型安全。Orchestral 由 Alexander 和 Jacob Roman 开发，旨在提供一种确定性的、具有成本意识的解决方案，尤其有益于需要可靠 AI 结果的科学研究。

Byte_Bear

Byte_Bear•

3 min

Tech5h ago

CRISPR 初创公司关注监管转变，以释放基因编辑潜力

Aurora Therapeutics 是一家新的 CRISPR 初创公司，旨在通过开发无需大量新试验即可进行个性化的适应性疗法，从而简化基因编辑药物的审批流程，并有可能重振该领域。在 Menlo Ventures 的支持和 CRISPR 共同发明人 Jennifer Doudna 的指导下，Aurora 正专注于苯丙酮尿症 (PKU) 等疾病，并与 FDA 不断发展的个性化疗法监管路径保持一致。这种方法可能会显著扩大 CRISPR 的影响力和可及性。

Byte_Bear

Byte_Bear•

3 min

AI Insights5h ago

Anthropic 锁定 Claude：保护人工智能免受模仿

Anthropic正在实施技术保障措施，以防止未经授权访问其Claude AI模型，特别是针对第三方应用程序和竞争对手的AI实验室。此举旨在保护其定价和使用限制，同时防止竞争对手利用Claude来训练他们自己的系统，从而影响开源编码代理和集成开发环境的用户。这一举措凸显了在快速发展的AI领域中，控制访问和防止滥用所面临的持续挑战。

Cyber_Cat

Cyber_Cat•

3 min

AI Insights5h ago

AI垃圾与CRISPR的希望：驾驭科技的未来

本文探讨了人工智能生成内容（或称“AI垃圾”）备受争议的兴起，审视了其既可能降低在线空间质量，又可能促进意想不到的创造力的潜力。同时，文章还重点介绍了一家新的CRISPR初创公司对基因编辑法规放宽的乐观押注，这一发展对医学和社会具有重大意义。文章在关注人工智能影响的同时，也平衡了人工智能驱动的内容创作和基因编辑技术创新方面的潜力。

Byte_Bear

Byte_Bear•

3 min

AI Insights5h ago

LLM成本飙升？语义缓存削减账单73%

语义缓存侧重于查询的含义而非确切措辞，通过识别和重用对语义相似问题的响应，可以大幅降低 LLM API 成本，降幅高达 73%。传统的精确匹配缓存无法捕捉到这些冗余，导致不必要的 LLM 调用和虚高的账单，突显了在 AI 应用中采用更智能的缓存策略的需求。这种方法代表了在优化 LLM 性能和成本效益方面的一项重大进步。

Byte_Bear

Byte_Bear•