Pesquisadores do Google podem ter resolvido um grande desafio da IA. Sua nova técnica, "RL interna", pode desbloquear agentes de IA de longo horizonte. A inovação, anunciada em 16 de janeiro de 2026, aborda limitações em como os modelos de IA aprendem o raciocínio complexo.
A RL interna direciona o funcionamento interno de um modelo. Ela guia a IA em direção a soluções passo a passo. Isso ignora o método tradicional de previsão do próximo token. Esse método geralmente leva a "alucinações" e falhas da IA.
O impacto imediato pode ser enorme. Especialistas acreditam que isso oferece um caminho para agentes autônomos. Esses agentes poderiam lidar com tarefas complexas e robótica do mundo real. Menos orientação humana seria necessária.
Os LLMs atuais são autorregressivos. Eles geram sequências token por token. Isso dificulta a exploração de novas estratégias. A RL interna oferece uma solução potencial.
As próximas etapas envolvem escalar e testar a técnica. O foco está em aplicações do mundo real. A comunidade de IA está observando atentamente. Isso pode revolucionar o desenvolvimento da IA.
Discussion
Join the conversation
Be the first to comment