OpenAI와 트레이닝 데이터 회사인 Handshake AI가 제3자 계약자들에게 과거 및 현재 역할에서 완료한 실제 업무를 업로드하도록 요청하고 있다고 Wired가 보도했습니다. 이 이니셔티브는 AI 기업들이 계약자를 활용하여 고품질 트레이닝 데이터를 생성하고, 궁극적으로 더 많은 화이트칼라 업무를 자동화하려는 광범위한 전략의 일환으로 보입니다.
Wired의 보도에 따르면 OpenAI의 내부 프레젠테이션은 계약자들에게 이전 직장에서 수행한 업무를 상세히 설명하고 Word 문서, PDF, PowerPoint 프레젠테이션, Excel 시트, 이미지 또는 코드 저장소와 같은 실질적인 업무 사례를 제공하도록 지시하는 것으로 알려졌습니다. 회사는 계약자들에게 업로드하기 전에 독점 정보 및 개인 식별 데이터를 제거하도록 권고하며, 이를 위해 "ChatGPT Superstar Scrubbing tool"을 제공합니다.
이러한 접근 방식은 심각한 지적 재산권 문제를 야기합니다. 지적 재산권 변호사인 Evan Brown은 Wired에 이 방법을 채택하는 모든 AI 연구소는 계약자의 신뢰성에 크게 의존하기 때문에 상당한 위험에 직면한다고 말했습니다. 우려는 계약자가 부주의하게 또는 의도적으로 저작권이 있거나 기밀 자료를 업로드하여 AI 모델에 통합될 수 있다는 데서 비롯됩니다.
계약자가 업로드한 데이터는 AI 모델을 훈련하여 인간의 업무 프로세스를 더 잘 이해하고 복제할 수 있도록 하는 데 사용됩니다. 이 프로세스에는 모델에 방대한 양의 데이터를 공급하여 정보 내에서 패턴과 관계를 식별하도록 하는 과정이 포함됩니다. 목표는 최소한의 인간 개입으로 복잡한 작업을 수행할 수 있는 AI 시스템을 만드는 것입니다.
실제 사례의 사용은 화이트칼라 직업을 정확하고 효과적으로 자동화할 수 있는 AI 모델을 개발하는 데 매우 중요하다고 여겨집니다. AI 시스템은 실제 업무 샘플을 기반으로 훈련함으로써 다양한 전문 업무의 뉘앙스와 복잡성을 처리하는 방법을 배울 수 있습니다. 그러나 이러한 데이터 사용에 대한 윤리적, 법적 의미는 여전히 논쟁의 여지가 있습니다.
현재 OpenAI가 업로드된 데이터를 어떻게 사용할 계획인지, 오용 또는 저작권 침해를 방지하기 위해 어떤 안전 장치가 마련되어 있는지 불분명합니다. 회사는 아직 보고서에 대한 공식 성명을 발표하지 않았습니다. 이 상황은 특히 민감하거나 독점적인 정보를 다룰 때 AI 훈련을 위한 데이터를 소싱하고 활용하는 데 관련된 어려움과 복잡성을 강조합니다. 이러한 개발 상황은 법률 전문가와 업계 관계자 모두가 면밀히 주시할 것으로 예상됩니다.
Discussion
대화에 참여하세요
첫 댓글을 남겨보세요