Pesquisadores do Google podem ter resolvido um grande desafio da IA. Eles desenvolveram o "RL interno", uma nova técnica para agentes de IA de longo horizonte. A inovação, revelada em 16 de janeiro de 2026, pode levar a uma IA que raciocina de forma mais eficaz.
O RL interno direciona o funcionamento interno de um modelo. Ajuda a IA a desenvolver soluções passo a passo. Isso ignora as limitações da previsão do próximo token. A IA atual frequentemente alucina ou falha em tarefas complexas.
O impacto imediato pode ser uma IA mais confiável. Especialistas acreditam que isso pode acelerar os agentes autônomos. A robótica do mundo real também pode se beneficiar.
Os LLMs normalmente aprendem prevendo a próxima palavra. Este método enfrenta dificuldades com o planejamento de longo prazo. O RL interno oferece uma abordagem diferente.
Os próximos passos envolvem escalar e testar a técnica. A equipe pretende aplicá-la a problemas do mundo real. Isso pode revolucionar as capacidades da IA.
Discussion
Join the conversation
Be the first to comment