OpenAIは9月、多様な業界におけるAIモデルの性能を人間の専門家と比較することを目的とした、新たな評価プロセスを開始しました。同社はこの比較を、ほとんどの経済的に価値のあるタスクにおいて人間の能力を凌駕できるAIシステムとして定義される、汎用人工知能(AGI)の実現に向けた進捗における重要な指標と見なしています。
あるOpenAIの機密文書には、「我々は、AIモデルがそれらのタスクでどれだけうまく機能するかを測定するために、あなたがフルタイムの仕事で行ってきたものをモデル化した、現実世界のタスクを収集するのを手伝ってもらうために、様々な職業の人々を雇用しました。あなたが職業で行ってきた長期または複雑な作業(数時間または数日)の既存のものを取得し、それぞれをタスクに変えてください」と記載されています。
このデータ収集の取り組みは、特にモデルがより洗練されるにつれて、AIの性能を評価するという継続的な課題を浮き彫りにしています。OpenAIは、AIの出力を現実世界の人間の仕事と比較することで、自社のモデルの強みと弱みをより正確に理解することを目指しています。このアプローチは、AI分野における、より厳格で人間中心の評価方法への高まりを反映しています。
AGIの達成がもたらす影響は広範囲に及び、産業を変革し、仕事の性質を再構築する可能性があります。OpenAIは、生産性とイノベーションの向上など、AGIの潜在的な利点を強調する一方で、その開発はまた、雇用の喪失や、ますます自律的なAIシステムの倫理的配慮に関する懸念も提起しています。
請負業者に仕事の提出を求めることは、データプライバシーと知的財産に関する疑問を投げかけます。OpenAIが提出されたタスクに含まれる機密情報の機密性を保護するためにどのような対策を講じているかは明らかではありません。同社は、データの悪用を防ぐために設けられている具体的な安全対策に関する詳細をまだ発表していません。
OpenAIは、より高度なAIモデルを開発するにつれて、評価方法を改良し続けています。同社が人間レベルの性能に焦点を当てていることは、AI開発を人間の価値観に合わせ、AIシステムが社会にとって有益であることを保証することの重要性を強調しています。これらの評価の結果は、OpenAIの研究開発の将来の方向性に影響を与える可能性があります。
Discussion
Join the conversation
Be the first to comment