OpenAIとトレーニングデータ企業のHandshake AIが、第三者の契約業者に対し、過去および現在の職務で完了した実際の業務成果をアップロードするよう要請していると、Wiredの報道が伝えています。この取り組みは、AI企業が契約業者を活用して高品質なトレーニングデータを生成し、最終的にはより多くのホワイトカラー業務を自動化するという、より広範な戦略の一環であるようです。
Wiredの報道によると、OpenAIの社内プレゼンテーションでは、契約業者に対し、以前の職務で実行したタスクを詳細に記述し、Word文書、PDF、PowerPointプレゼンテーション、Excelシート、画像、コードリポジトリなど、具体的な業務例を提供するよう指示しているとされています。同社は、アップロード前に機密情報や個人を特定できるデータを削除するよう契約業者に助言しており、この目的のために「ChatGPT Superstar Scrubbing tool」を提供しているとのことです。
このアプローチは、重大な知的財産に関する懸念を引き起こします。知的財産弁護士のエヴァン・ブラウン氏はWiredに対し、この手法を採用するAI研究所は、契約業者の信頼性に大きく依存するため、相当なリスクに直面すると語りました。懸念は、契約業者が誤って、または意図的に、著作権で保護された素材や機密資料をアップロードし、それがAIモデルに組み込まれる可能性があることに起因します。
契約業者がアップロードしたデータは、AIモデルをトレーニングし、人間の作業プロセスをより良く理解し、再現できるようにすることを目的としています。このプロセスでは、モデルに大量のデータを投入し、情報内のパターンと関係性を識別させます。目標は、人間の介入を最小限に抑えながら、複雑なタスクを実行できるAIシステムを作成することです。
実際の業務例の使用は、正確かつ効果的にホワイトカラーの仕事を自動化できるAIモデルを開発するために不可欠であると考えられています。本物の業務サンプルでトレーニングすることにより、AIシステムは、さまざまな専門的なタスクのニュアンスと複雑さを処理することを学習できます。ただし、そのようなデータの使用に関する倫理的および法的影響は、依然として継続的な議論の対象となっています。
現在、OpenAIがアップロードされたデータをどのように使用する予定なのか、また、誤用や著作権侵害を防ぐためにどのような保護措置が講じられているのかは不明です。同社は、この報道に関して公式声明をまだ発表していません。この状況は、特に機密情報や専有情報を取り扱う場合に、AIトレーニング用のデータを調達および利用する際に伴う課題と複雑さを浮き彫りにしています。この動向は、法律専門家や業界関係者によって注意深く監視されることになるでしょう。
Discussion
Join the conversation
Be the first to comment