지난 9월, OpenAI는 다양한 산업 분야의 인간 전문가들의 업무 능력과 자사의 AI 모델 성능을 비교하기 위한 새로운 평가 프로세스를 시작했습니다. OpenAI는 이러한 비교를 범용인공지능(AGI) 달성을 향한 중요한 지표로 간주하며, AGI는 대부분의 경제적으로 가치 있는 작업에서 인간의 능력을 능가할 수 있는 AI 시스템으로 정의됩니다.
한 기밀 OpenAI 문서에서는 "저희는 AI 모델이 해당 작업에서 얼마나 잘 수행하는지 측정하기 위해 여러분의 정규 직업에서 수행했던 실제 작업들을 모델로 삼아 다양한 직업군의 사람들을 고용하여 데이터를 수집하고 있습니다. 여러분의 직업에서 수행했던 장기적이거나 복잡한 작업(몇 시간 또는 며칠 소요)을 가져와 각각을 하나의 작업으로 만드십시오."라고 밝혔습니다.
데이터 수집 노력은 AI 성능 평가의 지속적인 과제를 강조하며, 특히 모델이 더욱 정교해짐에 따라 그 중요성이 더욱 커지고 있습니다. OpenAI는 AI 결과물을 실제 인간의 작업과 비교함으로써 자사 모델의 강점과 약점에 대한 더 정확한 이해를 얻는 것을 목표로 합니다. 이러한 접근 방식은 AI 분야에서 더욱 엄격하고 인간 중심적인 평가 방법으로 나아가는 추세를 반영합니다.
AGI 달성의 의미는 광범위하며, 산업을 변화시키고 업무의 본질을 재구성할 잠재력이 있습니다. OpenAI는 생산성 및 혁신 증가와 같은 AGI의 잠재적 이점을 강조하는 동시에, 일자리 감소 및 점점 더 자율적인 AI 시스템의 윤리적 고려 사항에 대한 우려도 제기합니다.
계약자들에게 그들의 작업을 제출하도록 요청하는 것은 데이터 프라이버시 및 지적 재산에 대한 의문을 제기합니다. OpenAI가 제출된 작업에 포함된 민감한 정보의 기밀성을 보호하기 위해 어떤 조치를 취하고 있는지는 명확하지 않습니다. 회사는 데이터 오용을 방지하기 위해 마련된 특정 안전 장치에 대한 자세한 내용을 아직 공개하지 않았습니다.
OpenAI는 더욱 발전된 AI 모델을 개발하면서 평가 방법론을 계속 개선하고 있습니다. 인간 수준의 성능에 대한 회사의 집중은 AI 개발을 인간의 가치와 일치시키고 AI 시스템이 사회에 유익하도록 보장하는 것의 중요성을 강조합니다. 이러한 평가 결과는 OpenAI의 연구 개발 노력의 미래 방향에 영향을 미칠 가능성이 높습니다.
Discussion
대화에 참여하세요
첫 댓글을 남겨보세요