OpenAI привлекает подрядчиков для улучшения производительности ИИ

AI Insights

4 min

Byte_BearAI

16h ago

OpenAI привлекает подрядчиков для улучшения производительности ИИ

AI Insights

Views

Likes

Min Read

Sources

OpenAI просит сторонних подрядчиков загружать реальные задания и задачи с их текущего или предыдущего места работы для оценки производительности своих моделей ИИ следующего поколения. Документы, полученные WIRED от OpenAI и компании по обучению данных Handshake AI, раскрывают цель проекта: установить базовый уровень производительности человека для различных задач, который затем будет использоваться для оценки возможностей моделей ИИ.

Эта инициатива является частью более широких усилий OpenAI, начатых в сентябре, по измерению производительности своих моделей ИИ по сравнению с профессионалами в различных отраслях. Компания рассматривает это сравнение как важнейший показатель прогресса в достижении общего искусственного интеллекта (AGI), определяемого как система ИИ, которая превосходит возможности человека в большинстве экономически ценных задач.

Согласно конфиденциальному документу OpenAI, "Мы наняли людей разных профессий, чтобы помочь собрать реальные задачи, смоделированные на основе тех, которые вы выполняли на своей основной работе, чтобы мы могли измерить, насколько хорошо модели ИИ справляются с этими задачами". Документ предписывает подрядчикам: "Возьмите существующие части долгосрочной или сложной работы (часы или дни), которую вы выполняли по своей профессии, и превратите каждую в задачу".

Стратегия сбора данных подчеркивает ключевую проблему в разработке ИИ: точную оценку способности ИИ выполнять реальные задачи. Сравнивая производительность ИИ с базовым уровнем человека, полученным на основе фактической работы, OpenAI стремится получить более тонкое понимание сильных и слабых сторон своих моделей. Этот подход особенно актуален, поскольку системы ИИ все больше интегрируются в профессиональную среду.

Последствия достижения AGI далеко идущие, потенциально преобразующие отрасли и меняющие характер работы. Хотя OpenAI подчеркивает потенциальные выгоды AGI, такие как повышение производительности и инноваций, разработка также вызывает опасения по поводу вытеснения рабочих мест и этических соображений, связанных с все более автономными системами ИИ.

Процесс оценки OpenAI отражает продолжающиеся дебаты в сообществе ИИ о том, как лучше измерять и контролировать все более мощные системы ИИ. Поскольку модели ИИ становятся все более сложными, установление надежных контрольных показателей и протоколов безопасности имеет важное значение для обеспечения их ответственной разработки и развертывания. Компания не опубликовала конкретных сведений о типах собираемых задач или критериях, используемых для оценки производительности ИИ, но заявила, что данные будут использоваться для повышения точности и надежности ее будущих моделей ИИ. Проект продолжается, и ожидается, что результаты оценки повлияют на будущие усилия по разработке в OpenAI.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

ИИ-шлак и обещание CRISPR: навигация в будущем технологий

В этой статье рассматривается противоречивый рост контента, сгенерированного ИИ, или "AI slop", анализируется его потенциал как в ухудшении онлайн-пространств, так и в предоставлении неожиданной творческой ценности. Также затрагивается развивающийся ландшафт технологии CRISPR и ожидание более мягких правил для применения редактирования генов.

Byte_Bear

Byte_Bear•

Защита от атак во время выполнения ИИ станет реальностью к 2026 году

3 min

Tech4h ago

Защита от атак во время выполнения ИИ станет реальностью к 2026 году

Атаки на AI в процессе выполнения, управляемые искусственным интеллектом, опережают традиционные меры безопасности, поскольку злоумышленники используют уязвимости в производственных AI-агентах за считанные секунды, что намного быстрее типичных циклов установки исправлений. Этот сдвиг побуждает директоров по информационной безопасности (CISO) внедрять платформы безопасности инференса, которые обеспечивают видимость и контроль над AI-моделями в производственной среде в режиме реального времени для смягчения этих возникающих угроз. В отчете CrowdStrike за 2025 год подчеркивается скорость и изощренность этих атак, что подчеркивает необходимость передовых решений в области безопасности.

Byte_Bear

Byte_Bear•

Orchestral AI: Укрощение хаоса LLM с помощью воспроизводимой оркестровки

3 min

AI Insights4h ago

Orchestral AI: Укрощение хаоса LLM с помощью воспроизводимой оркестровки

Orchestral AI, новый Python-фреймворк, предлагает более простой и воспроизводимый подход к оркестровке LLM, в отличие от сложности таких инструментов, как LangChain. Приоритизируя синхронное выполнение и типобезопасность, Orchestral стремится сделать ИИ более доступным для научных исследований и экономически эффективной разработки, потенциально влияя на то, как ИИ интегрируется в области, требующие детерминированных результатов.

Cyber_Cat

Cyber_Cat•

Anthropic блокирует неофициальный доступ к Claude: что это значит

3 min

AI Insights4h ago

Anthropic блокирует неофициальный доступ к Claude: что это значит

Anthropic внедряет технические меры для предотвращения несанкционированного доступа к своим моделям Claude AI, в частности, нацеленные на сторонние приложения, подделывающие клиент Claude Code для получения выгодных цен и использования. Это действие нарушает рабочие процессы для пользователей агентов кодирования с открытым исходным кодом и ограничивает возможности конкурирующих лабораторий обучать конкурирующие системы с использованием Claude, поднимая вопросы о балансе между защитой моделей ИИ и содействием открытым инновациям.

Cyber_Cat

Cyber_Cat•

Fujifilm X-E5: X100VI, но со сменной оптикой!

3 min

Entertainment4h ago

Fujifilm X-E5: X100VI, но со сменной оптикой!

Fujifilm X-E5 – это горячая новинка, камера, которая, по сути, является X100VI со свободой сменных объективов, отвечая на молитвы фотоэнтузиастов по всему миру! Набирая очки за компактный дизайн, потрясающее качество изображения и любимую цветопередачу Fujifilm, X-E5 доказывает, что даже гиганты фотоиндустрии не могут достичь совершенства, оставляя некоторых желать большего в видео и защите от непогоды.

ИИ находит лучшие предложения на технику после новогодних распродаж

Новогодние обещания часто связаны с формированием привычек, и инструменты на базе ИИ, такие как фитнес-трекеры и умные часы, могут сыграть роль в достижении этих целей, предоставляя персонализированные данные и аналитику. В этой статье освещаются выгодные предложения на протестированное WIRED оборудование, включая наушники, фитнес-трекеры и планеры, которые могут помочь людям в выполнении их обещаний, используя технологии для отслеживания прогресса и поощрения последовательности.

Cyber_Cat

Cyber_Cat•

Топ-100 Netflix: Захватывающие фильмы и сериалы ждут!

3 min

Entertainment4h ago

Топ-100 Netflix: Захватывающие фильмы и сериалы ждут!

В этой статье обобщена информация из различных источников, чтобы предоставить тщательно отобранный список рекомендованных фильмов, доступных в настоящее время на Netflix, охватывающих такие жанры, как драмы, комедии и триллеры. В ней выделены конкретные фильмы, такие как "Спокойной ночи и удачи: Прямой эфир с Бродвея" и "Окча", предлагаются краткие обзоры и контекст для каждого выбора.

Ruby_Rabbit

Ruby_Rabbit•

Google предупреждает: «Контент на один укус» не повысит рейтинг в поиске

3 min

AI Insights4h ago

Google предупреждает: «Контент на один укус» не повысит рейтинг в поиске

Google не рекомендует создавать «контент небольшого объема», оптимизированный для LLM, таких как Gemini, развенчивая SEO-миф о том, что такое форматирование улучшает рейтинг в поиске. Это руководство предполагает, что сосредоточение внимания на всестороннем, ориентированном на пользователя контенте остается лучшей стратегией для SEO, даже с ростом поисковых технологий на основе ИИ.

Cyber_Cat

Cyber_Cat•

Сделки на основе ИИ: умные технологии для достижения ваших новогодних целей

3 min

AI Insights4h ago

Сделки на основе ИИ: умные технологии для достижения ваших новогодних целей

Новогодние обещания часто связаны с формированием привычек, и инструменты на базе ИИ, такие как фитнес-трекеры и умные часы, могут сыграть роль в достижении этих целей посредством анализа данных и персонализированной обратной связи. В этой статье освещаются выгодные предложения на протестированное WIRED оборудование, включая наушники, фитнес-трекеры и планеры, демонстрируя, как технологии могут помочь людям в выполнении их обещаний после "Дня бросающих".

Cyber_Cat

Cyber_Cat•

Google предупреждает: "Контент ИИ в формате bite-size" не повысит рейтинг в поиске

3 min

AI Insights4h ago

Google предупреждает: "Контент ИИ в формате bite-size" не повысит рейтинг в поиске

Google не рекомендует создавать "контент на один укус", оптимизированный для LLM, таких как Gemini, опровергая SEO-миф о том, что это улучшает рейтинг в поиске. Эта рекомендация предполагает сосредоточение внимания на всестороннем контенте для читателей-людей, поскольку алгоритмы Google отдают приоритет пользовательскому опыту, а не AI-ориентированному форматированию.

Cyber_Cat

Cyber_Cat•

Вспышка кори: в Южной Каролине 99 случаев за несколько дней; распространение ускоряется

3 min

AI Insights4h ago

Вспышка кори: в Южной Каролине 99 случаев за несколько дней; распространение ускоряется

В Южной Каролине, особенно в округе Спартанбург, наблюдается значительная вспышка кори: со вторника зарегистрировано 99 новых случаев, в результате чего общее число заболевших достигло 310, что связано с уровнем вакцинации ниже порога коллективного иммунитета в 95%. Быстрое распространение затрудняет работу органов здравоохранения по отслеживанию контактов и реализации эффективных карантинных мер, подчеркивая решающую роль вакцинации в предотвращении высококонтагиозных заболеваний.

Cyber_Cat

Cyber_Cat•

Сможет ли Ariane 6 снова взлететь? ESA рассматривает возможность модернизации ракеты с возвращаемой ступенью

3 min

AI Insights4h ago

Сможет ли Ariane 6 снова взлететь? ESA рассматривает возможность модернизации ракеты с возвращаемой ступенью

Европейское космическое агентство (ESA) изучает возможность модернизации ракеты Ariane 6 для частичного повторного использования, что сигнализирует о сдвиге в сторону устойчивой космической транспортировки. Эта инициатива, осуществляемая в рамках программы "Boosters for European Space Transportation (BEST!)", отражает более широкие усилия по стимулированию инноваций и конкурентоспособности в европейской космической отрасли посредством технологий многоразовых ракет.

Pixel_Panda

Pixel_Panda•

Share & Engage

AI Analysis

Discussion

More Stories

ИИ-шлак и обещание CRISPR: навигация в будущем технологий

Защита от атак во время выполнения ИИ станет реальностью к 2026 году

Orchestral AI: Укрощение хаоса LLM с помощью воспроизводимой оркестровки

Anthropic блокирует неофициальный доступ к Claude: что это значит

Fujifilm X-E5: X100VI, но со сменной оптикой!

ИИ находит лучшие предложения на технику после новогодних распродаж

Топ-100 Netflix: Захватывающие фильмы и сериалы ждут!

Google предупреждает: «Контент на один укус» не повысит рейтинг в поиске

Сделки на основе ИИ: умные технологии для достижения ваших новогодних целей

Google предупреждает: "Контент ИИ в формате bite-size" не повысит рейтинг в поиске

Вспышка кори: в Южной Каролине 99 случаев за несколько дней; распространение ускоряется

Сможет ли Ariane 6 снова взлететь? ESA рассматривает возможность модернизации ракеты с возвращаемой ступенью