OpenAI가 VentureBeat에 따르면, 더욱 강력한 AI 에이전트를 향한 변화를 알리는 Responses API를 업그레이드했습니다. 2026년 2월 10일에 발표된 업데이트에는 AI 모델의 기능을 향상시키기 위해 설계된 서버 측 압축 및 호스팅 셸이 포함됩니다. 이러한 개선 사항은 맥락과 장기 기억에 어려움을 겪는 이전 AI 에이전트의 한계를 해결하는 것을 목표로 합니다.
이번 업그레이드는 업계가 AI 에이전트를 위한 대체 메모리 아키텍처를 탐구하면서 이루어졌습니다. Mastra가 개발한 "관찰 메모리"라는 접근 방식은 AI 에이전트 비용을 10배 절감하고 장기 맥락 벤치마크에서 Retrieval-Augmented Generation(RAG) 시스템보다 뛰어난 성능을 보일 것이라고 VentureBeat가 보도했습니다. 동적으로 맥락을 검색하는 RAG 시스템은 복잡하고 장기간 실행되는 에이전트형 AI 워크플로우에 충분하지 않은 것으로 입증되었습니다.
AI 에이전트의 진화는 글로벌 비즈니스 서비스(GBS)를 포함한 산업을 재편할 가능성에 대한 논의를 촉발했습니다. 목표 지향적인 행동이 가능한 에이전트형 AI의 약속은 널리 논의되었지만, 실제 배포는 지연되었습니다. VentureBeat 기고 편집자 Taryn Plumb는 2025년 12월 게시물에서 Google Cloud 및 Replit의 의견을 인용하여 에이전트형 AI를 확장하는 데 필요한 기본 요소가 여전히 부족하다고 지적했습니다.
AI 에이전트 개발은 또한 기술적인 문제에 직면해 있습니다. Hacker News의 한 사용자는 GPT-OSS-120b를 사용할 때 도구 호출에 어려움을 겪었다고 보고하며, 추론 엔진의 적절한 구현의 필요성을 강조했습니다. 사용자는 llama.cpp의 최신 버전이 도구 호출을 잘 처리하지만, 추가적인 양자화와 관련된 문제가 지속된다고 언급했습니다.
MIT Technology Review의 새로운 AI 뉴스레터 "Making AI Work"는 다양한 분야에서 AI의 실제 적용 사례를 탐구하고 있습니다. 이 뉴스레터는 특정 사용 사례를 검토하고 기업과 산업이 AI 도구를 어떻게 활용하고 있는지에 대한 맥락을 제공합니다.
Discussion
AI 전문가 & 커뮤니티
첫 댓글을 남겨보세요