Las habilidades de la IA se disparan: los LLM del MIT aprenden, no olvidan

Investigadores del MIT han desarrollado una nueva técnica para permitir que los modelos de lenguaje grandes (LLM) aprendan nuevas habilidades sin perder el conocimiento existente, según VentureBeat. La técnica, llamada ajuste fino por autodestilación (SDFT), permite a los modelos aprender directamente de demostraciones y sus propios experimentos. Esta innovación aborda un desafío clave en el ajuste fino de los LLM, donde la adición de nuevas habilidades puede borrar inadvertidamente información previamente aprendida, lo que obliga a las empresas a mantener modelos separados para cada habilidad.

El método SDFT, desarrollado por investigadores del MIT, el Improbable AI Lab y ETH Zurich, superó consistentemente al ajuste fino supervisado tradicional (SFT) en experimentos, informó VentureBeat. El nuevo método aprovecha las capacidades de aprendizaje en contexto de los LLM modernos.

Mientras tanto, el panorama de la inteligencia artificial continúa evolucionando rápidamente. Las empresas chinas han estado logrando avances significativos, con modelos que igualan el rendimiento de sus contrapartes occidentales a un costo menor, según MIT Technology Review. La empresa Moonshot AI lanzó recientemente su modelo de peso abierto, Kimi K2.5, que casi igualó el rendimiento de Claude Opus de Anthropic en algunos puntos de referencia, pero a una fracción del precio. La familia de modelos Qwen de Alibaba también ha superado a los modelos Llama de Meta en descargas en Hugging Face.

Los rápidos avances en la IA también están generando preocupaciones sobre el posible uso indebido. Según informó MIT Technology Review, los investigadores de ciberseguridad ya están viendo que la IA se utiliza para facilitar los delitos en línea. Un ejemplo involucró una sofisticada cepa de ransomware que cifró archivos en el sistema de una víctima, haciéndolos inutilizables hasta que se pagara un rescate.

La intersección de los mercados públicos y privados también está siendo remodelada por la IA y otros factores. Paul Wick, director de inversiones de Seligman, señaló un "cambio psicológico" en el mercado, con un aumento del miedo entre los inversores, según Fortune. El mecanismo de financiación para el complejo de LBO de software se ha visto interrumpido y los mercados de IPO han sido débiles.

En otras noticias, el descubrimiento de la Estela C, una piedra olmeca, proporcionó información crucial sobre la historia de la civilización olmeca, según Hacker News. La piedra, encontrada por los Stirlings, ayudó a determinar que los olmecas eran mucho más antiguos de lo que se creía. La fecha grabada en la piedra, 7.16.6.16.18 en el calendario de la Cuenta Larga mesoamericana, corresponde al 3 de septiembre del 32 a. C.