Pesquisadores do Google alcançaram um avanço que pode revolucionar a IA. Eles desenvolveram o "RL interno", uma técnica que permite que modelos de IA aprendam raciocínio complexo. Este avanço contorna as limitações da previsão tradicional de próximo token. A pesquisa, conduzida nos laboratórios de IA do Google, foi revelada em 16 de janeiro de 2026.
O RL interno direciona os processos internos de um modelo. Ele guia a IA em direção a soluções passo a passo. Essa abordagem permite que a IA lide com tarefas que normalmente fazem com que grandes modelos de linguagem falhem. Os LLMs atuais frequentemente alucinam ou têm dificuldades com o planejamento de longo prazo.
O impacto imediato pode ser uma nova geração de agentes de IA. Esses agentes poderiam realizar raciocínios complexos e controlar robôs do mundo real. Isso reduziria a necessidade de supervisão humana constante. Especialistas acreditam que este pode ser um caminho escalável para a IA autônoma.
Os LLMs atualmente dependem de modelos autorregressivos. Esses modelos geram sequências um token por vez. O aprendizado por reforço é usado para refinar esses modelos. No entanto, a previsão do próximo token limita sua capacidade de explorar novas estratégias.
O Google planeja desenvolver e testar ainda mais o RL interno. O foco estará na expansão de suas capacidades e aplicações no mundo real. As implicações para a robótica, automação e segurança da IA são significativas.
Discussion
Join the conversation
Be the first to comment