OpenAIとトレーニングデータ企業Handshake AIが、第三者の契約業者に対し、過去および現在の職務で完了した実際の業務成果をアップロードするよう要請していると、Wiredが報じた。この取り組みは、AI企業が契約業者を活用して高品質なトレーニングデータを生成し、最終的にはより多くのホワイトカラー業務を自動化するという、より広範な戦略の一環であるようだ。
報道によると、OpenAIの契約業者への指示には、他の職場で実行したタスクの詳細や、Word文書、PDF、PowerPointプレゼンテーション、Excelファイル、画像、コードリポジトリなどの具体的な業務成果の例の提供が含まれている。契約業者は、これらのファイルをアップロードする前に、機密情報や個人を特定できる情報を削除するように指示されており、OpenAIはこのプロセスを支援するために「ChatGPT Superstar Scrubbing tool」へのアクセスを提供している。
この慣行は、知的財産権に関する懸念を引き起こしている。知的財産弁護士のエヴァン・ブラウン氏はWiredに対し、このアプローチは、機密データを適切にスクラブする契約業者の信頼性に大きく依存するため、AI研究所にとって重大なリスクを伴うと語った。
高品質なトレーニングデータへの要求は、AIモデルの高度化によって推進されている。これらのモデル、特にOpenAIのGPTシリーズのような大規模言語モデル(LLM)は、効果的に学習しタスクを実行するために、膨大な量のデータを必要とする。このデータの品質は非常に重要であり、高品質なデータは、より正確で信頼性の高いAIシステムにつながる。AI企業は、完了した業務の実際の例を使用することで、複雑な知識ベースのタスクをより効果的に自動化できるモデルをトレーニングしたいと考えている。
ホワイトカラー業務の自動化の影響は広範囲に及ぶ。支持者はAIが効率と生産性を向上させると主張する一方、批判者は雇用の喪失と経済的不平等の拡大の可能性を懸念している。議論の中心は、AIが人間の能力を増強するのか、それとも多くの専門的な役割で完全に置き換えるのかという点にある。
OpenAIの取り組みの現状は、やや不明確なままである。参加している契約業者の数や、収集されている特定の種類の業務は不明である。このデータ収集の取り組みがOpenAIのモデルやより広範なAIの状況に及ぼす長期的な影響は、まだ見られていない。今後の展開は、データプライバシーと知的財産を取り巻く法的および倫理的考慮事項、そしてAI技術の進化する能力に左右される可能性が高い。
Discussion
Join the conversation
Be the first to comment