Wiredの報道によると、OpenAIとトレーニングデータ企業のHandshake AIは、契約社員に対し、過去および現在の職務における実際の業務サンプルを提出するよう求めているという。この取り組みは、AI企業の間で高品質なトレーニングデータの取得に重点を置く広範なトレンドの一環であると見られ、その目的は、より複雑なホワイトカラー業務を自動化できるようにモデルを強化することにある。
報道によると、OpenAIの契約社員への指示には、過去の職務で実行したタスクの詳細と、Word文書、PDF、PowerPointプレゼンテーション、Excelスプレッドシート、画像、コードリポジトリなど、完了した業務の具体的な例をアップロードすることが含まれている。同社は、契約社員に対し、これらのファイルをアップロードする前に、機密情報や個人を特定できるデータを削除するよう助言しており、この目的のために「ChatGPT Superstar Scrubbing tool」へのアクセスを提供しているという。
この慣行は、知的財産権に関する懸念を引き起こしている。知的財産弁護士のエヴァン・ブラウン氏はWiredに対し、AI研究所がこのアプローチを採用することは、機密データを適切にスクラブする契約社員の信頼性に大きく依存するため、重大なリスクに直面すると語った。
このデータ収集の根底にある原則は、AIモデルが現実世界のタスクを理解し、再現する能力を向上させることにある。AIモデル、特にOpenAIが開発したような大規模言語モデルは、パターンを学習し、正確な出力を生成するために、膨大な量のデータを必要とする。これらのモデルを実際の業務サンプルでトレーニングすることにより、企業は、通常は人間の専門知識を必要とするタスクを自動化する際のパフォーマンスを向上させることを目指している。
このトレンドの影響は、個々の企業にとどまらず、将来の働き方に影響を与える可能性がある。AIモデルがホワイトカラー業務の実行に熟達するにつれて、さまざまな業界で自動化が進む可能性がある。これにより、雇用パターンに変化が生じ、労働者はAI技術を補完する新しい役割に適応する必要が生じる可能性がある。
現在、この慣行がAI業界全体でどの程度普及しているのか、また、知的財産とプライバシーを保護するためにどのような安全対策が講じられているのかは不明である。AIトレーニングに実際の業務サンプルを使用することに関する法的および倫理的考察は、テクノロジーが進化し続けるにつれて、継続的な精査の対象となる可能性が高い。
Discussion
Join the conversation
Be the first to comment