OpenAI의 기밀 문서에 따르면, 회사는 "AI 모델이 실제 작업에서 얼마나 잘 수행하는지 측정하기 위해 다양한 직업의 사람들을 고용하여 여러분이 정규직에서 수행했던 작업을 모델로 삼아 실제 작업 데이터를 수집하도록 했습니다." 해당 문서는 계약자들에게 "여러분의 직업에서 수행했던 장기적이거나 복잡한 작업(몇 시간 또는 며칠 소요)을 가져와 각각을 작업으로 전환하라"고 지시합니다.
이 이니셔티브는 인공 일반 지능(AGI) 달성을 향한 OpenAI의 진행 상황을 평가하기 위한 광범위한 노력의 일환입니다. 9월에 OpenAI는 다양한 산업 분야의 인간 전문가와 AI 모델의 성능을 비교하는 데 초점을 맞춘 새로운 평가 프로세스를 시작했습니다. OpenAI는 AGI를 대부분의 경제적으로 가치 있는 작업에서 인간의 능력을 능가하는 AI 시스템으로 정의합니다.
이러한 실제 작업에서 수집된 데이터는 OpenAI의 AI 모델을 훈련하고 개선하는 데 사용되어 복잡한 과제를 더 잘 이해하고 실행할 수 있도록 합니다. AI 성능을 인간 기준선과 비교함으로써 OpenAI는 모델이 뛰어난 영역과 추가 개선이 필요한 영역을 식별하고자 합니다. 이 접근 방식은 다양한 전문적인 작업을 효과적으로 보강하거나 자동화할 수 있는 AI 시스템을 개발하는 데 중요합니다.
AGI 달성의 의미는 광범위하며 산업을 변화시키고 업무의 성격을 재구성할 가능성이 있습니다. AGI 개발은 생산성 향상 및 혁신과 같은 상당한 이점을 약속하지만, 일자리 감소 및 점점 더 자율적인 AI 시스템의 윤리적 고려 사항에 대한 우려도 제기합니다. 인간의 능력에 대한 AI 성능을 벤치마킹하려는 OpenAI의 노력은 이러한 복잡한 문제를 이해하고 해결하기 위한 단계입니다.
프로젝트의 현재 상태는 데이터 수집 및 분석이 진행 중입니다. OpenAI는 인간 기준선에 대한 모델 성능에 대한 구체적인 세부 정보를 아직 공개하지 않았습니다. 그러나 회사는 AGI 달성 목표를 향해 나아감에 따라 평가 프로세스를 계속 개선하고 새로운 데이터를 통합할 것으로 예상됩니다. 다음 개발 단계에는 수집된 데이터를 기반으로 한 AI 모델의 추가 반복과 더 광범위한 작업에 대한 성능에 대한 지속적인 평가가 포함될 가능성이 높습니다.
Discussion
대화에 참여하세요
첫 댓글을 남겨보세요