Wired의 보도에 따르면 OpenAI와 학습 데이터 회사인 Handshake AI가 제3자 계약자들에게 과거 및 현재 직무에서 완료한 실제 업무를 업로드하도록 요청하고 있는 것으로 알려졌습니다. 이러한 요청은 AI 기업들이 고품질 학습 데이터를 확보하여 자사 모델이 더 많은 사무직 업무를 자동화할 수 있도록 하려는 광범위한 전략의 일환으로 보입니다.
보도에 따르면 OpenAI의 발표 자료는 계약자들에게 이전 직무에서 수행한 업무를 상세히 설명하고 Word 문서, PDF, PowerPoint 프레젠테이션, Excel 파일, 이미지, 코드 저장소와 같은 실제 업무 결과물의 예시를 업로드하도록 지시합니다. 회사는 계약자들에게 이러한 파일을 업로드하기 전에 독점 정보 및 개인 식별 정보를 제거하도록 권고하며, 이를 위해 "ChatGPT Superstar Scrubbing tool"을 안내하는 것으로 알려졌습니다.
이러한 관행은 지적 재산권에 대한 우려를 불러일으킵니다. 지적 재산권 변호사인 Evan Brown은 Wired에 이 접근 방식이 AI 연구소에 상당한 위험을 제기한다고 말했습니다. 왜냐하면 민감한 데이터를 적절하게 제거하는 계약자의 신뢰성에 크게 의존하기 때문입니다.
실제 데이터에 대한 요구는 AI 모델의 성능과 기능을 향상시키기 위한 고품질 학습 데이터 세트에 대한 수요 증가를 반영합니다. 특히 OpenAI의 GPT 시리즈와 같은 대규모 언어 모델(LLM)은 효과적으로 학습하고 일반화하기 위해 방대한 양의 데이터가 필요합니다. AI 개발자들은 실제 업무 샘플을 학습함으로써 복잡한 작업을 보다 정확하게 복제하고 자동화할 수 있는 모델을 만들기를 희망합니다.
그러나 이러한 전략은 윤리적, 법적 문제도 제기합니다. 저작권이 있거나 기밀 정보의 사용은 익명화되었더라도 잠재적인 소송과 회사 평판 손상으로 이어질 수 있습니다. 또한 데이터의 편향 가능성에 대한 우려도 있으며, 이는 신중하게 다루지 않으면 차별적인 결과를 영속화할 수 있습니다.
이러한 데이터 수집 전략의 장기적인 영향은 상당합니다. AI 모델이 더 광범위한 사무직 업무를 성공적으로 자동화할 수 있다면 노동 시장에 상당한 변화를 가져와 다양한 산업 분야의 근로자를 대체할 가능성이 있습니다. 이러한 영향의 정도는 아직 불확실하지만 전문가들은 AI의 발전과 사회에 미칠 잠재적 결과를 면밀히 주시하고 있습니다.
OpenAI는 아직 이 보고서에 대한 공식 성명을 발표하지 않았습니다. AI 윤리 및 데이터 프라이버시에 대한 논쟁이 계속 진화함에 따라 회사의 행동은 규제 기관과 업계 관계자들의 면밀한 조사를 받을 것으로 예상됩니다.
Discussion
대화에 참여하세요
첫 댓글을 남겨보세요