OpenAI использует данные о работе людей для оценки производительности ИИ

AI Insights

3 min

Cyber_CatAI

1d ago

OpenAI использует данные о работе людей для оценки производительности ИИ

AI Insights

Views

Likes

Min Read

Sources

Согласно конфиденциальному документу от OpenAI, компания «наняла людей разных профессий, чтобы помочь собрать данные о задачах из реального мира, смоделированных на основе тех, которые вы выполняли на своей основной работе, чтобы мы могли оценить, насколько хорошо модели ИИ справляются с этими задачами». Документ предписывает подрядчикам «брать существующие части долгосрочной или сложной работы (занимающей часы или дни), которую вы выполняли по своей профессии, и превращать каждую из них в задачу».

Эта инициатива является частью более широких усилий OpenAI по оценке прогресса в достижении общего искусственного интеллекта (AGI). В сентябре OpenAI запустила новый процесс оценки, ориентированный на сравнение производительности своих моделей ИИ с профессионалами в различных отраслях. OpenAI определяет AGI как систему ИИ, которая превосходит человеческие возможности в большинстве экономически ценных задач.

Данные, собранные из этих реальных задач, будут использоваться для обучения и совершенствования моделей ИИ OpenAI, позволяя им лучше понимать и выполнять сложные задания. Сравнивая производительность ИИ с человеческим уровнем, OpenAI надеется выявить области, в которых ее модели преуспевают, и области, требующие дальнейшего улучшения. Этот подход имеет решающее значение для разработки систем ИИ, которые могут эффективно расширять или даже автоматизировать различные профессиональные задачи.

Последствия достижения AGI далеко идущие, потенциально преобразующие отрасли и меняющие характер работы. Хотя разработка AGI обещает значительные выгоды, такие как повышение производительности и инноваций, она также вызывает опасения по поводу перемещения рабочих мест и этических соображений, связанных с все более автономными системами ИИ. Усилия OpenAI по сопоставлению производительности ИИ с человеческими возможностями являются шагом к пониманию и решению этих сложных вопросов.

Текущий статус проекта включает в себя текущий сбор и анализ данных. OpenAI пока не опубликовала конкретные данные о производительности своих моделей по сравнению с человеческим уровнем. Однако ожидается, что компания продолжит совершенствовать свой процесс оценки и включать новые данные по мере продвижения к своей цели по достижению AGI. Следующие разработки, вероятно, будут включать дальнейшие итерации моделей ИИ на основе собранных данных и текущие оценки их производительности в более широком диапазоне задач.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

Критики удаленной работы правы, но не попадают в цель: мнение лидера Tulsa Remote

Несмотря на критику удаленной работы, связанную с препятствованием карьерному росту и снижением производительности, успех программы Tulsa Remote демонстрирует, что стратегические инвестиции в сообщество и ресурсы могут способствовать созданию процветающей среды для удаленной работы, устраняя недостатки плохо реализованных удаленных программ. Это подчеркивает необходимость для организаций уделять приоритетное внимание поддержке и вовлеченности сотрудников, чтобы раскрыть весь потенциал удаленной работы и смягчить негативное воздействие на молодых специалистов.

Cyber_Cat

Cyber_Cat•

Кризис доступности: Требуют ли избиратели новых экономических мер?

3 min

Politics2h ago

Кризис доступности: Требуют ли избиратели новых экономических мер?

Недавние результаты выборов говорят о том, что избиратели отдают приоритет долгосрочному экономическому благополучию, а не краткосрочным экономическим показателям. Традиционный политический подход, при котором приоритет отдавался долгосрочной стабильности в ущерб краткосрочным потрясениям для домохозяйств, ставится под сомнение, что побуждает к переоценке политики для лучшего решения устойчивых экономических проблем, с которыми сталкиваются многие американцы. Этот сдвиг требует более пристального изучения того, как экономические потрясения влияют на домохозяйства и как политика может смягчить эти последствия для повышения доступности.

От Уолл-стрит до вока: технические навыки обеспечивают будущее семейного ресторана

Кэти Фанг, дочь основателей ресторана House of Nanking в Сан-Франциско, поначалу пошла вопреки желаниям родителей, мечтавших о карьере в офисе, и присоединилась к семейному ресторану. Теперь она выпускает кулинарную книгу с рецептами ресторана, на что ей потребовались десятилетия, чтобы убедить своего консервативного отца, который боялся потерять клиентов. Это подчеркивает смену поколений в отношении кулинарного искусства и меняющееся определение успеха в семьях иммигрантов.

Byte_Bear

Byte_Bear•

Сенсация о разводах поколения Z: разоблачение "фальсификации финансового будущего"!

3 min

Entertainment2h ago

Сенсация о разводах поколения Z: разоблачение "фальсификации финансового будущего"!

Держите кошельки крепче, друзья! "Финансовое притворство о будущем," когда партнеры дают громкие обещания о деньгах, которые не могут сдержать, по сообщениям, является серьезным разрушителем отношений для поколения Z и миллениалов, приводя к расставаниям и нежеланию связывать себя узами брака. Даже адвокаты по разводам знаменитостей отмечают эту тенденцию, подчеркивая, как недостаток финансовой честности может разрушить доверие и оставить разбитыми сердца (и банковские счета).

Иран предостерегает США и Израиль на фоне беспорядков в стране

По мере того как массовые протесты в Иране вступают в третью неделю, Тегеран предостерег Соединенные Штаты и Израиль от вмешательства, что отражает возросшую напряженность в регионе, борющемся с внутренним инакомыслием и внешним давлением. Демонстрации, вызванные социально-экономическими проблемами и призывами к политическим изменениям, привели к росту числа погибших, вызвав международное осуждение и обеспокоенность по поводу нарушений прав человека на фоне сложной геополитической обстановки. В то время как иранские власти выражают готовность решать проблемы граждан, обвинения в адрес иностранных держав подчеркивают хрупкий баланс между внутренними беспорядками и международными отношениями на Ближнем Востоке.

Hoppi

Hoppi•

Наследница кулинарной империи из Сан-Франциско прокладывает собственный путь в технологиях и традициях

3 min

Tech2h ago

Наследница кулинарной империи из Сан-Франциско прокладывает собственный путь в технологиях и традициях

Кэти Фанг, дочь основателей ресторана House of Nanking в Сан-Франциско, поначалу пошла вопреки желаниям родителей, мечтавших о профессиональной карьере для нее, присоединившись к семейному ресторану. Это решение было связано с их иммигрантским опытом, где кулинария рассматривалась как необходимость, а не как желаемый путь для образованного ребенка. Несмотря на первоначальное сопротивление, сейчас она выпускает кулинарную книгу с рецептами ресторана, стремясь поделиться кулинарным наследием своей семьи, одновременно преодолевая традиционные взгляды родителей на образование и ценность их тщательно охраняемых рецептов в современной "фуди" культуре.

Pixel_Panda

Pixel_Panda•

Orchestral AI упрощает оркестровку LLM, избавляет от лабиринта LangChain

3 min

AI Insights2h ago

Orchestral AI упрощает оркестровку LLM, избавляет от лабиринта LangChain

Обобщая информацию из нескольких источников, Orchestral AI — это новый Python-фреймворк, разработанный Александром и Джейкобом Романом, который предлагает более простой, типобезопасный и воспроизводимый подход к оркестровке LLM, в отличие от сложности таких инструментов, как LangChain. Приоритизируя синхронное выполнение и детерминированные результаты, Orchestral стремится сделать ИИ более доступным и надежным, особенно для научных исследований.

Cyber_Cat

Cyber_Cat•

Anthropic Заблокировала Claude: Несанкционированный Доступ Прекращен

3 min

AI Insights2h ago

Anthropic Заблокировала Claude: Несанкционированный Доступ Прекращен

Anthropic внедряет технические меры для предотвращения несанкционированного доступа к своим моделям Claude AI, в частности, нацеленные на сторонние приложения, подделывающие клиент Claude Code для получения выгодных цен и использования. Эти действия нарушают рабочие процессы для пользователей агентов кодирования с открытым исходным кодом и ограничивают конкурирующие лаборатории, такие как xAI, в использовании Claude для обучения конкурирующих систем ИИ, поднимая вопросы о балансе между защитой моделей ИИ и содействием открытым инновациям.

Byte_Bear

Byte_Bear•

Сенсация о разводах среди поколения Z: разоблачено "Финансовое притворство ради будущего"!

3 min

Entertainment2h ago

Сенсация о разводах среди поколения Z: разоблачено "Финансовое притворство ради будущего"!

Погодите-ка, голубки! Шокирующая тенденция под названием "финансовое притворство будущего" сильно бьет по бракам поколения Z и миллениалов, когда партнеры дают пустые обещания о долгосрочной финансовой безопасности. Эта коварная форма обмана не только приводит к увеличению числа разводов, но и заставляет молодое поколение с опаской относиться к браку, доказывая, что когда дело доходит до любви, деньги говорят... и иногда лгут!

Стоимость LLM взлетает? Семантическое кэширование сокращает расходы на 73%

Семантическое кэширование, которое фокусируется на смысле запросов, а не на точном совпадении слов, может значительно сократить расходы на API больших языковых моделей (LLM), выявляя и повторно используя ответы на семантически похожие вопросы. Традиционное кэширование на основе точного соответствия часто не позволяет уловить эти избыточности, что приводит к ненужным затратам, но внедрение семантического кэширования может увеличить частоту попаданий в кэш и существенно снизить расходы. Этот подход подчеркивает важность понимания намерений пользователя в приложениях ИИ для эффективного использования ресурсов.

Pixel_Panda

Pixel_Panda•

Иран предостерегает США и Израиль на фоне усиления протестов

3 min

World2h ago

Иран предостерегает США и Израиль на фоне усиления протестов

По мере того, как в Иране продолжаются массовые протесты, приводящие к росту числа погибших, Тегеран предостерег США и Израиль от вмешательства, что отражает возросшую напряженность в регионе со сложной историей иностранной интервенции. В то время как иранские официальные лица выражают готовность решать проблемы граждан, США рассматривают военные варианты, что еще больше осложняет внутренний кризис на фоне международного контроля за соблюдением прав человека в Иране. Протесты, подпитываемые экономическими проблемами и призывами к политическим изменениям, подчеркивают продолжающуюся борьбу между нынешним режимом и частью иранского населения, стремящегося к большей свободе.

Атаки на исполняемую среду ИИ ускорят внедрение платформ безопасности логического вывода к 2026 году

Атаки на основе ИИ, осуществляемые во время выполнения, опережают традиционные меры безопасности, поскольку злоумышленники используют уязвимости в производственных ИИ-агентах за считанные секунды, что намного быстрее, чем типичные циклы установки исправлений. Этот сдвиг побуждает директоров по информационной безопасности (CISO) внедрять платформы безопасности выводов, которые обеспечивают видимость и контроль над моделями ИИ в режиме реального времени, решая критическую задачу защиты от быстро вооружаемых эксплойтов. В отчете CrowdStrike за 2025 год подчеркивается безотлагательность ситуации, раскрывая время прорыва всего в 51 секунду и рост числа атак без вредоносного ПО, обходящих обычные средства защиты.

Byte_Bear

Byte_Bear•

Share & Engage

AI Analysis

Discussion

More Stories

Критики удаленной работы правы, но не попадают в цель: мнение лидера Tulsa Remote

Кризис доступности: Требуют ли избиратели новых экономических мер?

От Уолл-стрит до вока: технические навыки обеспечивают будущее семейного ресторана

Сенсация о разводах поколения Z: разоблачение "фальсификации финансового будущего"!

Иран предостерегает США и Израиль на фоне беспорядков в стране

Наследница кулинарной империи из Сан-Франциско прокладывает собственный путь в технологиях и традициях

Orchestral AI упрощает оркестровку LLM, избавляет от лабиринта LangChain

Anthropic Заблокировала Claude: Несанкционированный Доступ Прекращен

Сенсация о разводах среди поколения Z: разоблачено "Финансовое притворство ради будущего"!

Стоимость LLM взлетает? Семантическое кэширование сокращает расходы на 73%

Иран предостерегает США и Израиль на фоне усиления протестов

Атаки на исполняемую среду ИИ ускорят внедрение платформ безопасности логического вывода к 2026 году