Pesquisadores do Google podem ter resolvido um grande desafio da IA. Eles desenvolveram o "RL interno", uma nova técnica para treinar modelos de IA. Essa inovação pode desbloquear agentes de IA de longo horizonte. As descobertas foram publicadas em 16 de janeiro de 2026.
O RL interno direciona o funcionamento interno de um modelo. Ele guia a IA para a resolução de problemas passo a passo. Isso ignora as limitações da previsão do próximo token. Os LLMs atuais frequentemente têm dificuldades com o raciocínio complexo.
O impacto imediato pode ser significativo. Os agentes de IA podem se tornar mais autônomos. Eles poderiam lidar com tarefas complexas sem supervisão humana constante. Isso tem implicações para a robótica e outros campos.
Os LLMs tradicionalmente aprendem por meio da previsão do próximo token. Este método pode ser ineficiente para o planejamento de longo prazo. O RL interno oferece uma abordagem mais direta. Ele se concentra no desenvolvimento de estratégias de alto nível.
As próximas etapas envolvem mais testes e refinamento. Os pesquisadores pretendem escalar a técnica. O objetivo final é criar agentes de IA verdadeiramente autônomos. Isso poderia revolucionar a forma como a IA interage com o mundo.
Discussion
Join the conversation
Be the first to comment