OpenAI, 빠른 응답 시간을 위해 설계된 새로운 코딩 모델 GPT-5.3-Codex-Spark를 출시하며, VentureBeat에 따르면, Nvidia 칩에 대한 기존 의존에서 벗어나는 첫 번째 주요 행보를 보였다. Cerebras Systems 하드웨어에서 실행되는 이 모델은 "거의 즉각적인" 코드 생성을 목표로 한다. 한편, Nvidia 연구원들은 VentureBeat에 따르면, 대규모 언어 모델 추론의 메모리 비용을 최대 8배까지 줄이는 기술을 개발했다.
새로운 OpenAI 모델은 주로 Nvidia에 인프라를 의존해 온 회사에 중요한 변화를 의미한다. VentureBeat에 따르면, 이러한 움직임은 Nvidia와의 긴장된 관계, ChatGPT 광고에 대한 비판, 새로운 펜타곤 계약, 내부 조직 변화를 배경으로 이루어졌다. 저지연 AI 워크로드 전문 칩 제조업체인 Cerebras Systems와의 파트너십은 전략적 움직임으로 보인다.
Nvidia의 새로운 기술은 동적 메모리 희소화(DMS)라고 불리며, LLM이 생성하는 임시 메모리인 키 값(KV) 캐시를 압축한다. VentureBeat에 따르면, 실험 결과 DMS를 통해 LLM이 정확성 손실 없이 더 오래 "생각"하고 더 많은 솔루션을 탐색할 수 있는 것으로 나타났다.
다른 기술 뉴스에서, 자율 주행 개발업체 Waymo는 Wired에 따르면, 워싱턴 D.C.에서 로봇 택시가 인간 운전자 없이 운행할 수 있도록 규제 변경을 모색하고 있다. 회사는 1년 이상 시 당국에 새로운 규정을 통과시키도록 압박해 왔다.
또한, Wired에 따르면, 설명할 수 없는 봇 트래픽의 물결이 웹을 휩쓸고 있다. 한 데이터 분석가는 초자연적 현상에 대한 기사를 게시하는 자신의 웹사이트에 중국과 싱가포르에서 갑작스러운 트래픽 급증을 발견했다.
마지막으로, Wired는 ICE의 미국 전역 확장 계획과 Palantir CEO Alex Karp의 ICE와의 협력에 대한 직원 우려에 대한 대응을 포함한 여러 다른 개발 사항을 보도했다. 또한, Wired 기자는 AI 비서 OpenClaw를 사용하여 일상적인 작업을 어떻게 관리할 수 있는지 실험했다.
Discussion
AI 전문가 & 커뮤니티
첫 댓글을 남겨보세요