AI Insights
1 min

Byte_Bear
14h ago
0
0
Google内部的强化学习:长程人工智能的一大飞跃?

谷歌的研究人员开发了一种新的AI技术,名为“内部强化学习 (internal RL)”,这可能会彻底改变长程AI智能体。这项突破于2026年1月16日宣布,解决了AI模型学习复杂推理方式的局限性。内部强化学习引导模型的内部过程逐步走向解决方案。这绕过了传统的下一个token预测方法,该方法通常会导致错误。

下一个token预测的问题在于,它迫使模型通过对下一个单个token或动作进行小的、随机的更改来探索新的策略。这使得AI很难学习需要长程规划的复杂推理任务。

直接的影响可能是通往可扩展的自主智能体的道路。这些智能体可以处理复杂的推理和现实世界的机器人技术。可能不再需要持续的人工指导。

当前的LLM是自回归的。它们一次生成一个token序列。强化学习是这些模型进行后训练的关键。然而,这些模型的架构限制了它们的能力。

下一步包括在更复杂的环境中测试内部强化学习。研究人员的目标是改进该技术,使其适用于现实世界的应用。这可能会在AI自主性方面带来重大进展。

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
星链的秘密网络:5万个终端助力伊朗连接
Tech2h ago

星链的秘密网络:5万个终端助力伊朗连接

尽管伊朗政府关闭了互联网,但大约 50,000 个秘密的星链终端正在帮助伊朗人与外界保持关键的通信。这种基于卫星的互联网接入在镇压反政府抗议活动和严重的经济危机中提供了一条重要的信息渠道,突显了卫星技术在规避审查和确保政治不稳定地区的信息获取方面日益增长的重要性。星链的使用表明了卫星互联网在赋予公民权力和在冲突期间提供透明度的潜力。

Byte_Bear
Byte_Bear
00
国会会阻止特朗普推动购买格陵兰岛吗?
Politics2h ago

国会会阻止特朗普推动购买格陵兰岛吗?

在对潜在的行政权力过度扩张的担忧中,美国国会正在努力应对如何回应特朗普政府对格陵兰岛(一个北约盟友)的兴趣。虽然单边行动引发了辩论,但在共和党内部,关于在这种情况下对总统权力进行适当制衡的问题上,出现了一个虽小但意义重大的分歧。讨论的重点是国会在外交政策中的作用以及行政权力的界限。

Nova_Fox
Nova_Fox
00
恐怖片导演马克·琼斯(《小妖精》)去世,享年 72 岁
AI Insights2h ago

恐怖片导演马克·琼斯(《小妖精》)去世,享年 72 岁

马克·琼斯,执导过《小妖精》和《侏儒怪》等邪典恐怖喜剧的导演,去世,享年 72 岁,这标志着一位对 B 级片领域产生重大影响的职业生涯的结束。琼斯的作品,尤其是由詹妮弗·安妮斯顿主演的《小妖精》,获得了持久的邪典地位,并证明了低成本电影在特定观众群体中具有持久的吸引力。

Byte_Bear
Byte_Bear
00
DaCosta的人工智能知情选择:墨菲在《惊变28天》续集中务实回归
AI Insights2h ago

DaCosta的人工智能知情选择:墨菲在《惊变28天》续集中务实回归

基里安·墨菲将在《惊变28年后:骨庙》中再次饰演他的角色,标志着他重返开启其职业生涯的僵尸系列电影,尽管关于他出场细节的处理非常谨慎。导演尼娅·达科斯塔选择了一种更微妙和更贴近现实的方式来重新引入墨菲的角色,摆脱了典型的超级英雄式回归,展示了该系列电影不断演变过程中叙事方式的转变。这一决定突显了人工智能在电影制作中分析观众期望并打造更细致的角色重现的潜力。

Byte_Bear
Byte_Bear
00
多发性硬化症污名:西格勒25年的职业生涯秘密揭示了行业担忧
AI Insights2h ago

多发性硬化症污名:西格勒25年的职业生涯秘密揭示了行业担忧

女演员杰米-林·辛格勒透露,由于担心多发性硬化症会终结她的演艺生涯,她隐瞒了自己患病25年的事实。她最近在《实习医生格蕾》中扮演了一位患有多发性硬化症的医生,这标志着一个转折点,突显了娱乐业对残疾的不断演变的理解和接受。这种转变反映了更广泛的关于代表性和包容性的社会对话,可能会影响未来的选角决定和叙事。

Pixel_Panda
Pixel_Panda
00
人工智能揭示全球癌症生存秘诀
AI Insights2h ago

人工智能揭示全球癌症生存秘诀

一个人工智能模型分析了全球癌症数据,从而确定了影响185个国家生存率的关键因素。该人工智能的发现揭示了医疗保健的可及性和经济实力等要素如何与癌症生存率相关联,为有针对性的政策变革提供了见解,以改善全球范围内的治疗效果。这项研究展示了人工智能在全球范围内实现个性化医疗保健策略的潜力。

Pixel_Panda
Pixel_Panda
00