Согласно сообщению Wired, OpenAI и компания Handshake AI, занимающаяся данными для обучения, предположительно, просят сторонних подрядчиков загружать реальные работы, выполненные ими в прошлом и настоящем. Эта инициатива, по-видимому, является частью более широкой стратегии AI-компаний по привлечению подрядчиков для создания высококачественных данных для обучения, с конечной целью автоматизации большего числа задач, выполняемых "белыми воротничками".
Согласно отчету Wired, во внутренней презентации OpenAI якобы дается указание подрядчикам подробно описывать задачи, выполнявшиеся на предыдущих местах работы, и предоставлять ощутимые примеры работ, такие как документы Word, PDF-файлы, презентации PowerPoint, таблицы Excel, изображения или репозитории кода. Компания, как сообщается, советует подрядчикам удалять конфиденциальную информацию и персональные данные перед загрузкой, предлагая для этой цели "инструмент очистки ChatGPT Superstar".
Такой подход вызывает серьезные опасения по поводу интеллектуальной собственности. Эван Браун, юрист по вопросам интеллектуальной собственности, заявил Wired, что любая AI-лаборатория, использующая этот метод, подвергается значительному риску, поскольку он в значительной степени зависит от надежности ее подрядчиков. Опасения связаны с тем, что подрядчики могут непреднамеренно или намеренно загрузить материалы, защищенные авторским правом или являющиеся конфиденциальными, которые затем могут быть включены в AI-модели.
Данные, загружаемые подрядчиками, предназначены для обучения AI-моделей, позволяя им лучше понимать и воспроизводить процессы работы человека. Этот процесс включает в себя загрузку в модели огромного количества данных, что позволяет им выявлять закономерности и взаимосвязи в информации. Цель состоит в том, чтобы создать AI-системы, способные выполнять сложные задачи с минимальным вмешательством человека.
Использование реальных примеров считается крайне важным для разработки AI-моделей, которые могут точно и эффективно автоматизировать работу "белых воротничков". Обучаясь на подлинных образцах работы, AI-системы могут научиться справляться с нюансами и сложностями различных профессиональных задач. Однако этические и юридические последствия использования таких данных остаются предметом постоянных дискуссий.
В настоящее время неясно, как OpenAI планирует использовать загруженные данные и какие меры предосторожности приняты для предотвращения злоупотреблений или нарушения авторских прав. Компания пока не опубликовала официального заявления по поводу этого сообщения. Эта ситуация подчеркивает проблемы и сложности, связанные с поиском и использованием данных для обучения AI, особенно при работе с конфиденциальной или частной информацией. Развитие событий, вероятно, будет внимательно отслеживаться как юристами, так и отраслевыми наблюдателями.
Discussion
Join the conversation
Be the first to comment