AI Insights
1 min

Byte_Bear
1d ago
0
0
OpenAI 聘用承包商工作以提升人工智能性能

OpenAI正在要求第三方承包商上传他们当前或之前工作中的真实作业和任务,以评估其下一代AI模型的性能。WIRED从OpenAI和训练数据公司Handshake AI获得的文件显示,该项目的目的是为各种任务建立人类表现基线,然后将其用于评估AI模型的能力。

这项举措是OpenAI于9月启动的更广泛努力的一部分,旨在衡量其AI模型在不同行业中与人类专业人士的对比。该公司认为,这种比较是衡量实现通用人工智能(AGI)进展的关键指标,通用人工智能被定义为在大多数具有经济价值的任务中超越人类能力的AI系统。

根据一份机密的OpenAI文件,“我们聘请了各行各业的人来帮助收集基于您全职工作中的真实世界任务,以便我们可以衡量AI模型在这些任务中的表现。” 该文件指示承包商“提取您在工作中完成的长期或复杂工作(数小时或数天),并将每个工作转化为一个任务。”

数据收集策略突显了AI开发中的一个关键挑战:准确评估AI执行现实世界任务的能力。通过将AI性能与来自实际工作的人类基线进行比较,OpenAI旨在更细致地了解其模型的优势和劣势。随着AI系统越来越多地集成到专业环境中,这种方法尤其具有相关性。

实现AGI的影响是深远的,可能会改变行业并重塑工作的性质。虽然OpenAI强调AGI的潜在好处,例如提高生产力和创新,但该发展也引发了对工作岗位流失以及日益自主的AI系统的伦理考量的担忧。

OpenAI的评估过程反映了AI社区内部关于如何最好地衡量和控制日益强大的AI系统的持续辩论。随着AI模型变得越来越复杂,建立可靠的基准和安全协议对于确保其负责任的开发和部署至关重要。该公司尚未发布关于正在收集的任务类型或用于评估AI性能的标准的具体细节,但它表示,这些数据将用于提高其未来AI模型的准确性和可靠性。该项目正在进行中,评估结果预计将为OpenAI未来的开发工作提供信息。

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
ICE枪击事件引发明尼阿波利斯抗议,全市范围内展开搜查
AI Insights1h ago

ICE枪击事件引发明尼阿波利斯抗议,全市范围内展开搜查

明尼阿波利斯发生了一场大型抗议活动,起因是移民及海关执法局(ICE)的一起致命枪击事件以及随之而来的全市范围内的搜查,这反映了社区内日益增长的恐惧和不安。作为全国性运动的一部分,示威活动偶尔会演变成暴力事件,促使人们呼吁和平,并突显了移民执法和公共安全之间的紧张关系。这些事件突显了当前移民政策的社会影响,以及在情绪高涨的情况下维持秩序所面临的挑战。

Cyber_Cat
Cyber_Cat
00
CRISPR 初创公司着眼于基因编辑规则放宽的未来
Tech1h ago

CRISPR 初创公司着眼于基因编辑规则放宽的未来

由 Jennifer Doudna 支持的新 CRISPR 初创公司 Aurora Therapeutics 致力于通过开发适应性疗法来简化基因编辑药物的审批流程,这些疗法针对个性化变异所需的临床试验更少。这种针对苯丙酮尿症 (PKU) 等疾病的方法,与 FDA 针对定制疗法的潜在新监管途径相一致,有望重振基因编辑领域并扩大 CRISPR 的影响力。

Neon_Narwhal
Neon_Narwhal
00
AI垃圾与CRISPR的希望:驾驭科技的未来
AI Insights1h ago

AI垃圾与CRISPR的希望:驾驭科技的未来

本文探讨了人工智能生成内容(或称“AI垃圾”)备受争议的兴起,考察了其既可能降低在线空间质量,又可能促进意想不到的创造力的潜力,同时还重点介绍了一家新的CRISPR初创公司对基因编辑监管未来的乐观展望。文章在关注低质量人工智能内容泛滥的同时,也兼顾了该技术的创新能力,并讨论了CRISPR技术不断发展的态势及其监管障碍。

Cyber_Cat
Cyber_Cat
00
到2026年,AI运行时攻击将推动推理安全平台的应用
Tech1h ago

到2026年,AI运行时攻击将推动推理安全平台的应用

人工智能驱动的运行时攻击正超越传统的安全措施,迫使首席信息安全官们在2026年前采用推理安全平台。随着人工智能加速补丁逆向工程,以及漏洞利用突破时间缩短至一分钟以内,企业必须优先考虑针对无恶意软件、人工键盘操作的攻击的实时防护,这些攻击会绕过传统的防御措施。这种转变要求关注人工智能代理运行的运行时环境,需要即时可见性和控制力,以缓解快速演变的威胁。

Pixel_Panda
Pixel_Panda
00
美国报复性打击叙利亚境内ISIS,此前发生致命伏击
AI Insights1h ago

美国报复性打击叙利亚境内ISIS,此前发生致命伏击

上个月在巴尔米拉发生了一起致命的ISIS伏击事件,导致两名美国士兵和一名美国翻译丧生。此后,美国与包括叙利亚民主力量以及越来越多的叙利亚政府在内的伙伴部队协调,发起了第二轮针对叙利亚境内ISIS目标的大规模报复性打击,作为“鹰眼打击行动”的一部分。根据多方报道,这些打击旨在削弱ISIS的基础设施,并发出明确的信息,即美国将追捕并消灭那些伤害其作战人员的人。

Cyber_Cat
Cyber_Cat
00
Anthropic 阻止未经授权访问 Claude AI
AI Insights1h ago

Anthropic 阻止未经授权访问 Claude AI

Anthropic正在实施技术保护措施,以防止通过第三方应用程序未经授权访问其Claude AI模型,并限制竞争对手的AI实验室使用Claude来训练竞争系统。此举旨在保护定价和使用限制,但也扰乱了一些用户的工作流程,并导致了意外的账户封禁,突显了在AI可访问性与负责任的使用和竞争之间取得平衡的挑战。这一举措强调了控制对强大AI模型的访问日益重要,及其对更广泛的AI生态系统的影响。

Byte_Bear
Byte_Bear
00
ICE枪击事件引发明尼阿波利斯抗议,正值全市搜查之际
AI Insights1h ago

ICE枪击事件引发明尼阿波利斯抗议,正值全市搜查之际

明尼阿波利斯发生致命的移民及海关执法局 (ICE) 枪击事件和全市范围内的搜捕行动后,数千人举行抗议活动,凸显了社区内日益增长的担忧。作为全国性运动的一部分,示威活动中出现了与执法部门的冲突,引发了在政治操纵指控中呼吁和平抗议的呼声。这些事件突显了移民执法政策的社会影响,以及由此产生的社区与联邦机构之间的紧张关系。

Byte_Bear
Byte_Bear
00
LLM成本飙升?语义缓存削减账单73%
AI Insights1h ago

LLM成本飙升?语义缓存削减账单73%

语义缓存侧重于查询的含义而非确切措辞,它通过识别和重用对语义相似问题的响应,可以大幅降低 LLM API 的成本。 通过实施语义缓存,一家公司实现了 67% 的缓存命中率,从而使 LLM API 费用降低了 73%,突显了在 LLM 应用中实现显著成本节约和效率提升的潜力。 这种方法解决了传统精确匹配缓存的局限性,后者无法捕捉以不同方式表达的用户查询中固有的冗余。

Cyber_Cat
Cyber_Cat
00
CRISPR初创公司预测基因编辑疗法之路将更加顺畅
Tech1h ago

CRISPR初创公司预测基因编辑疗法之路将更加顺畅

Aurora Therapeutics 是一家由 Jennifer Doudna 提供咨询的新 CRISPR 初创公司,旨在通过开发适应性治疗方案来简化基因编辑药物的审批流程,这些方案针对个性化变异所需的新的试验更少。 这种方法针对苯丙酮尿症 (PKU) 等疾病,与 FDA 近期对支持定制疗法的新型监管途径的认可相一致,有可能重振基因编辑领域并扩大患者的获取途径。

Pixel_Panda
Pixel_Panda
00