Согласно конфиденциальному документу от OpenAI, компания «наняла людей разных профессий, чтобы помочь собрать данные о задачах из реального мира, смоделированных на основе тех, которые вы выполняли на своей основной работе, чтобы мы могли оценить, насколько хорошо модели ИИ справляются с этими задачами». Документ предписывает подрядчикам «брать существующие части долгосрочной или сложной работы (занимающей часы или дни), которую вы выполняли по своей профессии, и превращать каждую из них в задачу».
Эта инициатива является частью более широких усилий OpenAI по оценке прогресса в достижении общего искусственного интеллекта (AGI). В сентябре OpenAI запустила новый процесс оценки, ориентированный на сравнение производительности своих моделей ИИ с профессионалами в различных отраслях. OpenAI определяет AGI как систему ИИ, которая превосходит человеческие возможности в большинстве экономически ценных задач.
Данные, собранные из этих реальных задач, будут использоваться для обучения и совершенствования моделей ИИ OpenAI, позволяя им лучше понимать и выполнять сложные задания. Сравнивая производительность ИИ с человеческим уровнем, OpenAI надеется выявить области, в которых ее модели преуспевают, и области, требующие дальнейшего улучшения. Этот подход имеет решающее значение для разработки систем ИИ, которые могут эффективно расширять или даже автоматизировать различные профессиональные задачи.
Последствия достижения AGI далеко идущие, потенциально преобразующие отрасли и меняющие характер работы. Хотя разработка AGI обещает значительные выгоды, такие как повышение производительности и инноваций, она также вызывает опасения по поводу перемещения рабочих мест и этических соображений, связанных с все более автономными системами ИИ. Усилия OpenAI по сопоставлению производительности ИИ с человеческими возможностями являются шагом к пониманию и решению этих сложных вопросов.
Текущий статус проекта включает в себя текущий сбор и анализ данных. OpenAI пока не опубликовала конкретные данные о производительности своих моделей по сравнению с человеческим уровнем. Однако ожидается, что компания продолжит совершенствовать свой процесс оценки и включать новые данные по мере продвижения к своей цели по достижению AGI. Следующие разработки, вероятно, будут включать дальнейшие итерации моделей ИИ на основе собранных данных и текущие оценки их производительности в более широком диапазоне задач.
Discussion
Join the conversation
Be the first to comment