MIT 연구진, LLM이 기존 지식을 잃지 않고 새로운 기술을 습득하는 새로운 기술 개발 - VentureBeat 보도에 따르면, MIT 연구진이 대규모 언어 모델(LLM)이 기존 지식을 잃지 않고 새로운 기술을 습득할 수 있도록 하는 새로운 기술을 개발했다. 자기 증류 미세 조정(SDFT)이라고 불리는 이 기술은 모델이 시연과 자체 실험을 통해 직접 학습할 수 있도록 한다. 이 혁신은 새로운 기술을 추가하면 이전에 학습한 정보가 의도치 않게 지워져 기업이 각 기술별로 별도의 모델을 유지해야 하는 LLM 미세 조정의 주요 과제를 해결한다.
MIT, Improbable AI Lab, ETH 취리히 연구진이 개발한 SDFT 방법은 실험에서 기존의 지도 학습 미세 조정(SFT)보다 일관적으로 우수한 성능을 보였다고 VentureBeat는 보도했다. 새로운 방법은 현대 LLM의 문맥 내 학습 능력을 활용한다.
한편, 인공지능 분야는 계속해서 빠르게 발전하고 있다. MIT Technology Review에 따르면, 중국 기업들이 상당한 진전을 이루어 서방 경쟁사 수준의 성능을 더 낮은 비용으로 달성하고 있다. 최근 Moonshot AI는 오픈 가중치 모델인 Kimi K2.5를 출시했는데, 일부 벤치마크에서 Anthropic의 Claude Opus와 거의 비슷한 성능을 보였지만 가격은 훨씬 저렴했다. Alibaba의 Qwen 모델 제품군도 Hugging Face에서 Meta의 Llama 모델보다 다운로드 수가 많았다.
AI의 급속한 발전은 잠재적인 오용에 대한 우려도 제기하고 있다. MIT Technology Review의 보도에 따르면, 사이버 보안 연구원들은 이미 온라인 범죄를 더 쉽게 만들기 위해 AI가 사용되는 것을 목격하고 있다. 한 예로, 피해자의 시스템에서 파일을 암호화하여 몸값을 지불할 때까지 사용할 수 없게 만드는 정교한 랜섬웨어 변종이 있었다.
공공 시장과 사모 시장의 교차점 또한 AI 및 기타 요인에 의해 재편되고 있다. Seligman의 최고 투자 책임자인 Paul Wick은 Fortune에 따르면, 투자자들 사이에서 증가하는 두려움과 함께 시장의 "심리적 변화"를 언급했다. 소프트웨어 LBO 복합체의 자금 조달 메커니즘이 붕괴되었고, IPO 시장은 부진했다.
다른 소식으로, Olmec 석재인 Stela C의 발견은 Olmec 문명의 역사에 대한 중요한 통찰력을 제공했다고 Hacker News는 보도했다. Stirling 부부가 발견한 이 석재는 Olmecs가 이전에 믿었던 것보다 훨씬 오래되었다는 것을 밝히는 데 도움이 되었다. 석재에 새겨진 날짜인 Meso-American Long Count 달력의 7.16.6.16.18은 기원전 32년 9월 3일에 해당한다.
Discussion
AI 전문가 & 커뮤니티
첫 댓글을 남겨보세요