Pesquisadores do MIT desenvolveram uma nova técnica para permitir que modelos de linguagem grandes (LLMs) aprendam novas habilidades sem perder o conhecimento existente, de acordo com a VentureBeat. A técnica, chamada de ajuste fino por autodistilação (SDFT), permite que os modelos aprendam diretamente a partir de demonstrações e de seus próprios experimentos. Essa inovação aborda um desafio fundamental no ajuste fino de LLMs, onde a adição de novas habilidades pode inadvertidamente apagar informações previamente aprendidas, forçando as empresas a manter modelos separados para cada habilidade.
O método SDFT, desenvolvido por pesquisadores do MIT, do Improbable AI Lab e da ETH Zurich, superou consistentemente o ajuste fino supervisionado tradicional (SFT) em experimentos, relatou a VentureBeat. O novo método aproveita as capacidades de aprendizado no contexto de LLMs modernos.
Enquanto isso, o cenário da inteligência artificial continua a evoluir rapidamente. Empresas chinesas têm feito progressos significativos, com modelos que correspondem ao desempenho de seus homólogos ocidentais a um custo menor, de acordo com a MIT Technology Review. A empresa Moonshot AI lançou recentemente seu modelo de peso aberto, Kimi K2.5, que quase igualou o desempenho do Claude Opus da Anthropic em alguns benchmarks, mas a uma fração do preço. A família de modelos Qwen da Alibaba também superou os modelos Llama da Meta em downloads no Hugging Face.
Os rápidos avanços em IA também estão levantando preocupações sobre o potencial uso indevido. Conforme relatado pela MIT Technology Review, pesquisadores de segurança cibernética já estão vendo a IA sendo usada para facilitar crimes online. Um exemplo envolveu uma sofisticada cepa de ransomware que criptografou arquivos no sistema de uma vítima, tornando-os inutilizáveis até que um resgate fosse pago.
A interseção dos mercados público e privado também está sendo remodelada pela IA e outros fatores. Paul Wick, diretor de investimentos da Seligman, observou uma "mudança psicológica" no mercado, com aumento do medo entre os investidores, de acordo com a Fortune. O mecanismo de financiamento para o complexo de LBO de software foi interrompido, e os mercados de IPO têm sido fracos.
Em outras notícias, a descoberta da Estela C, uma pedra olmeca, forneceu informações cruciais sobre a história da civilização olmeca, de acordo com o Hacker News. A pedra, encontrada pelos Stirlings, ajudou a determinar que os olmecas eram muito mais antigos do que se pensava anteriormente. A data gravada na pedra, 7.16.6.16.18 no calendário de Contagem Longa Mesoamericano, corresponde a 3 de setembro de 32 a.C.
Discussion
AI Experts & Community
Be the first to comment