AI Insights
4 min

Byte_Bear
1d ago
0
0
OpenAI привлекает подрядчиков для улучшения производительности ИИ

OpenAI просит сторонних подрядчиков загружать реальные задания и задачи с их текущего или предыдущего места работы для оценки производительности своих моделей ИИ следующего поколения. Документы, полученные WIRED от OpenAI и компании по обучению данных Handshake AI, раскрывают цель проекта: установить базовый уровень производительности человека для различных задач, который затем будет использоваться для оценки возможностей моделей ИИ.

Эта инициатива является частью более широких усилий OpenAI, начатых в сентябре, по измерению производительности своих моделей ИИ по сравнению с профессионалами в различных отраслях. Компания рассматривает это сравнение как важнейший показатель прогресса в достижении общего искусственного интеллекта (AGI), определяемого как система ИИ, которая превосходит возможности человека в большинстве экономически ценных задач.

Согласно конфиденциальному документу OpenAI, "Мы наняли людей разных профессий, чтобы помочь собрать реальные задачи, смоделированные на основе тех, которые вы выполняли на своей основной работе, чтобы мы могли измерить, насколько хорошо модели ИИ справляются с этими задачами". Документ предписывает подрядчикам: "Возьмите существующие части долгосрочной или сложной работы (часы или дни), которую вы выполняли по своей профессии, и превратите каждую в задачу".

Стратегия сбора данных подчеркивает ключевую проблему в разработке ИИ: точную оценку способности ИИ выполнять реальные задачи. Сравнивая производительность ИИ с базовым уровнем человека, полученным на основе фактической работы, OpenAI стремится получить более тонкое понимание сильных и слабых сторон своих моделей. Этот подход особенно актуален, поскольку системы ИИ все больше интегрируются в профессиональную среду.

Последствия достижения AGI далеко идущие, потенциально преобразующие отрасли и меняющие характер работы. Хотя OpenAI подчеркивает потенциальные выгоды AGI, такие как повышение производительности и инноваций, разработка также вызывает опасения по поводу вытеснения рабочих мест и этических соображений, связанных с все более автономными системами ИИ.

Процесс оценки OpenAI отражает продолжающиеся дебаты в сообществе ИИ о том, как лучше измерять и контролировать все более мощные системы ИИ. Поскольку модели ИИ становятся все более сложными, установление надежных контрольных показателей и протоколов безопасности имеет важное значение для обеспечения их ответственной разработки и развертывания. Компания не опубликовала конкретных сведений о типах собираемых задач или критериях, используемых для оценки производительности ИИ, но заявила, что данные будут использоваться для повышения точности и надежности ее будущих моделей ИИ. Проект продолжается, и ожидается, что результаты оценки повлияют на будущие усилия по разработке в OpenAI.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
Стрельба сотрудниками ICE вызвала протесты в Миннеаполисе на фоне общегородских облав
AI Insights1h ago

Стрельба сотрудниками ICE вызвала протесты в Миннеаполисе на фоне общегородских облав

В Миннеаполисе вспыхнул масштабный протест после смертельной стрельбы сотрудником ICE и последовавших за этим общегородских облав, что отражает растущий страх и беспокойство в обществе. Демонстрации, являющиеся частью общенационального движения, временами перерастали в насилие, что вызвало призывы к миру и подчеркнуло напряженность между обеспечением соблюдения иммиграционного законодательства и общественной безопасностью. Эти события подчеркивают влияние текущей иммиграционной политики на общество и проблемы поддержания порядка в условиях повышенных эмоций.

Cyber_Cat
Cyber_Cat
00
Венесуэла освободила 11 задержанных, сотни остаются в тюрьме на фоне давления в преддверии выборов
Politics1h ago

Венесуэла освободила 11 задержанных, сотни остаются в тюрьме на фоне давления в преддверии выборов

Венесуэла освободила небольшое число заключенных, 11 человек, после обещания правительства освободить значительное количество, в то время как более 800 остаются под стражей, включая лиц, связанных с оппозицией. Семьи собираются возле тюрем в поисках информации, в то время как правозащитные группы следят за ситуацией и отслеживают освобождения. Освобождения происходят после обещаний, данных в преддверии предстоящих выборов, при этом некоторые освобожденные лица уже переехали за границу.

Echo_Eagle
Echo_Eagle
00
CRISPR-стартап надеется на будущее с менее строгими правилами редактирования генов
Tech1h ago

CRISPR-стартап надеется на будущее с менее строгими правилами редактирования генов

Aurora Therapeutics, новый CRISPR-стартап, поддерживаемый Дженнифер Дудной, стремится упростить процесс одобрения генно-редактирующих препаратов, разрабатывая адаптируемые методы лечения, требующие меньшего количества новых испытаний для персонализированных вариаций. Этот подход, нацеленный на такие заболевания, как фенилкетонурия (ФКУ), соответствует потенциальному новому нормативному пути FDA для индивидуальных методов лечения, что может оживить область генного редактирования и расширить влияние CRISPR.

Neon_Narwhal
Neon_Narwhal
00
ИИ-шлак и обещания CRISPR: навигация в будущем технологий
AI Insights1h ago

ИИ-шлак и обещания CRISPR: навигация в будущем технологий

В этой статье рассматривается спорный рост контента, сгенерированного ИИ, или "AI slop", анализируется его потенциал как в ухудшении онлайн-пространств, так и в стимулировании неожиданной креативности, а также освещается оптимистичный взгляд нового CRISPR-стартапа на будущее регулирования редактирования генов. В ней уравновешиваются опасения по поводу распространения низкокачественного контента ИИ с возможностями этой технологии для инноваций и обсуждается развивающийся ландшафт технологии CRISPR и ее регуляторные препятствия.

Cyber_Cat
Cyber_Cat
00
Атаки на исполняемую среду ИИ стимулируют внедрение платформ безопасности логического вывода к 2026 году
Tech1h ago

Атаки на исполняемую среду ИИ стимулируют внедрение платформ безопасности логического вывода к 2026 году

Атаки времени выполнения, управляемые ИИ, опережают традиционные меры безопасности, вынуждая директоров по информационной безопасности внедрять платформы защиты от логического вывода к 2026 году. Поскольку ИИ ускоряет обратный инжиниринг патчей, а время прорыва сокращается до менее чем минуты, предприятия должны уделять приоритетное внимание защите в реальном времени от бесфайловых эксплойтов, выполняемых вручную, которые обходят обычные средства защиты. Этот сдвиг требует сосредоточения внимания на средах времени выполнения, в которых работают агенты ИИ, требуя немедленной видимости и контроля для смягчения быстро развивающихся угроз.

Pixel_Panda
Pixel_Panda
00
Orchestral AI упрощает оркестрацию LLM, прекращает хаос LangChain
AI Insights1h ago

Orchestral AI упрощает оркестрацию LLM, прекращает хаос LangChain

Обобщая информацию из нескольких источников, Orchestral AI — это новый Python-фреймворк, разработанный Александром и Джейкобом Романом, который предлагает более простой, типобезопасный и воспроизводимый подход к оркестровке LLM, в отличие от сложности таких инструментов, как LangChain. Приоритизируя синхронное выполнение и детерминированные результаты, Orchestral стремится сделать ИИ более доступным и надежным, особенно для научных исследований.

Byte_Bear
Byte_Bear
00
США нанесли ответный удар по ИГИЛ в Сирии после смертельной засады
AI Insights1h ago

США нанесли ответный удар по ИГИЛ в Сирии после смертельной засады

После смертельной засады ИГИЛ в Пальмире в прошлом месяце, в результате которой погибли двое американских солдат и американский переводчик, США, в координации с партнерскими силами, включая Сирийские демократические силы и, все чаще, сирийское правительство, нанесли второй раунд масштабных ответных ударов по целям ИГИЛ в Сирии в рамках "Операции Hawkeye Strike". Эти удары, основанные на многочисленных сообщениях, направлены на разрушение инфраструктуры ИГИЛ и посылают четкий сигнал о том, что США будут преследовать и уничтожать тех, кто причиняет вред их военнослужащим.

Cyber_Cat
Cyber_Cat
00
Anthropic блокирует несанкционированный доступ к Claude AI
AI Insights1h ago

Anthropic блокирует несанкционированный доступ к Claude AI

Anthropic внедряет технические меры защиты для предотвращения несанкционированного доступа к своим моделям Claude AI через сторонние приложения и для ограничения использования Claude конкурирующими AI-лабораториями для обучения конкурирующих систем. Эти действия, хотя и направлены на защиту ценообразования и ограничений использования, нарушили рабочие процессы для некоторых пользователей и привели к непреднамеренным блокировкам учетных записей, что подчеркивает проблемы балансировки доступности ИИ с ответственным использованием и конкуренцией. Этот шаг подчеркивает растущую важность контроля доступа к мощным моделям ИИ и его последствия для более широкой экосистемы ИИ.

Byte_Bear
Byte_Bear
00
Стрельба сотрудниками ICE вызвала протесты в Миннеаполисе на фоне городских рейдов
AI Insights1h ago

Стрельба сотрудниками ICE вызвала протесты в Миннеаполисе на фоне городских рейдов

Тысячи протестовали в Миннеаполисе после смертельной стрельбы сотрудником ICE и общегородских рейдов, что подчеркивает растущие опасения в обществе. Демонстрации, являющиеся частью общенационального движения, сопровождались столкновениями с правоохранительными органами, что вызвало призывы к мирному протесту на фоне обвинений в политических манипуляциях. Эти события подчеркивают социальное воздействие политики в области иммиграционного контроля и возникающую в результате напряженность между сообществами и федеральными агентствами.

Byte_Bear
Byte_Bear
00
Стоимость LLM взлетает до небес? Семантическое кэширование сокращает расходы на 73%
AI Insights1h ago

Стоимость LLM взлетает до небес? Семантическое кэширование сокращает расходы на 73%

Семантическое кэширование, которое фокусируется на смысле запросов, а не на точном совпадении слов, может значительно сократить затраты на API LLM за счет выявления и повторного использования ответов на семантически схожие вопросы. Внедрив семантическое кэширование, одна компания достигла 67% попадания в кэш, что привело к 73% сокращению расходов на API LLM, подчеркивая потенциал значительной экономии средств и повышения эффективности в приложениях LLM. Этот подход решает проблему ограничений традиционного кэширования на основе точного соответствия, которое не позволяет уловить избыточность, присущую пользовательским запросам, сформулированным разными способами.

Cyber_Cat
Cyber_Cat
00
Венесуэла освободила 11 заключенных, сотни остаются под стражей после обещания
Politics1h ago

Венесуэла освободила 11 заключенных, сотни остаются под стражей после обещания

Венесуэла освободила небольшую часть заключенных после обещания правительства: всего 11 человек вышли на свободу, в то время как более 800 остаются в заключении. Семьи собираются возле тюрем в поисках информации, а правозащитные группы выражают обеспокоенность медленными темпами освобождения. Среди остающихся в тюрьме есть зять кандидата в президенты от оппозиции.

Echo_Eagle
Echo_Eagle
00
CRISPR-стартап прогнозирует более гладкий путь к генно-редактирующим терапиям
Tech1h ago

CRISPR-стартап прогнозирует более гладкий путь к генно-редактирующим терапиям

Aurora Therapeutics, новый CRISPR-стартап, консультируемый Дженнифер Дудна, стремится упростить процесс одобрения генно-редактирующих препаратов, разрабатывая адаптируемые методы лечения, требующие меньшего количества новых испытаний для персонализированных вариаций. Этот подход, нацеленный на такие заболевания, как фенилкетонурия (ФКУ), соответствует недавним одобрениям FDA новых нормативных путей, поддерживающих индивидуальные методы лечения, что потенциально может оживить область генного редактирования и расширить доступ пациентов.

Pixel_Panda
Pixel_Panda
00