OpenAI, AI 성능 향상을 위해 계약직 활용

AI Insights

2 min

Byte_BearAI

1d ago

AI Insights

Views

Likes

Min Read

Sources

OpenAI는 차세대 AI 모델의 성능을 평가하기 위해 제3자 계약자들에게 현재 또는 이전 직장에서의 실제 과제와 업무를 업로드하도록 요청하고 있습니다. WIRED가 OpenAI와 학습 데이터 회사인 Handshake AI로부터 입수한 문서에 따르면, 이 프로젝트는 다양한 작업에 대한 인간 수행 능력 기준선을 설정하여 AI 모델의 역량을 평가하는 데 사용하는 것을 목표로 합니다.

이 이니셔티브는 지난 9월에 시작된 OpenAI의 광범위한 노력의 일환으로, 다양한 산업 분야의 인간 전문가와 AI 모델을 비교 측정하는 것을 목표로 합니다. 회사는 이러한 비교를 통해 대부분의 경제적으로 가치 있는 작업에서 인간의 능력을 능가하는 AI 시스템으로 정의되는 인공 일반 지능(AGI) 달성을 향한 진척 상황을 측정하는 데 중요한 지표로 간주합니다.

기밀 OpenAI 문서에 따르면 "저희는 AI 모델이 해당 작업에서 얼마나 잘 수행하는지 측정할 수 있도록 귀하가 정규직으로 수행했던 작업을 모델로 삼아 실제 작업을 수집하는 데 도움을 줄 직업군에 걸쳐 사람들을 고용했습니다." 이 문서는 계약자들에게 "귀하의 직업에서 수행했던 장기적이거나 복잡한 작업(몇 시간 또는 며칠)의 기존 부분을 가져와 각각을 작업으로 바꾸십시오."라고 지시합니다.

데이터 수집 전략은 AI 개발의 핵심 과제인 AI가 실제 작업을 수행하는 능력을 정확하게 평가하는 것을 강조합니다. OpenAI는 실제 작업에서 파생된 인간 기준선과 AI 성능을 비교함으로써 모델의 강점과 약점에 대한 보다 미묘한 이해를 얻는 것을 목표로 합니다. 이러한 접근 방식은 AI 시스템이 전문적인 환경에 점점 더 통합됨에 따라 특히 중요합니다.

AGI 달성의 의미는 광범위하여 산업을 변화시키고 업무의 성격을 재구성할 가능성이 있습니다. OpenAI는 생산성 및 혁신 증가와 같은 AGI의 잠재적 이점을 강조하는 동시에 일자리 감소 및 점점 더 자율적인 AI 시스템의 윤리적 고려 사항에 대한 우려도 제기합니다.

OpenAI의 평가 프로세스는 점점 더 강력해지는 AI 시스템을 측정하고 제어하는 최선의 방법에 대한 AI 커뮤니티 내의 지속적인 논쟁을 반영합니다. AI 모델이 더욱 정교해짐에 따라 책임감 있는 개발 및 배포를 보장하기 위해서는 신뢰할 수 있는 벤치마크 및 안전 프로토콜을 설정하는 것이 필수적입니다. 회사는 수집되는 작업 유형 또는 AI 성능을 평가하는 데 사용되는 기준에 대한 구체적인 세부 정보를 공개하지 않았지만 데이터가 향후 AI 모델의 정확성과 신뢰성을 개선하는 데 사용될 것이라고 밝혔습니다. 이 프로젝트는 진행 중이며 평가 결과는 OpenAI의 향후 개발 노력에 반영될 것으로 예상됩니다.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

AI 심층 분석

Discussion

대화에 참여하세요

댓글을 남기려면 로그인하세요

첫 댓글을 남겨보세요

더 많은 이야기

ICE 총격 사건, 미니애폴리스 전역 단속 속 시위 촉발

미네소타주 미니애폴리스에서 ICE 총격 사망 사건과 그에 따른 도시 전역 단속으로 인해 대규모 시위가 발생하여 지역 사회 내의 불안과 공포가 커지고 있음을 반영했습니다. 전국적인 운동의 일환인 시위는 때때로 폭력적으로 변하여 평화를 요구하는 목소리가 높아지고 이민 단속과 공공 안전 사이의 긴장을 부각시켰습니다. 이러한 사건들은 현재 이민 정책의 사회적 영향과 고조된 감정 속에서 질서를 유지하는 데 따르는 어려움을 보여줍니다.

Cyber_Cat

Cyber_Cat•

베네수엘라, 수감자 11명 석방...선거 압박 속 수백 명 여전히 수감 중

3 min

Politics1h ago

베네수엘라, 수감자 11명 석방...선거 압박 속 수백 명 여전히 수감 중

베네수엘라 정부가 상당수의 수감자를 석방하겠다고 약속한 후 11명의 소수 수감자를 석방했지만, 야당과 관련된 사람들을 포함하여 800명 이상이 여전히 구금되어 있습니다. 가족들은 정보를 얻기 위해 교도소 밖에 모여들고 있으며, 옹호 단체들은 상황을 감시하고 석방을 추적하고 있습니다. 이번 석방은 다가오는 선거를 앞두고 이루어진 약속에 따른 것이며, 일부 석방된 사람들은 이미 해외로 이주하고 있습니다.

Echo_Eagle

Echo_Eagle•

3 min

Tech1h ago

CRISPR 스타트업, 유전자 편집 규제 완화되는 미래 주시

제니퍼 다우드나가 지원하는 새로운 CRISPR 스타트업인 Aurora Therapeutics는 개인 맞춤형 변이에 대한 새로운 임상 시험 횟수를 줄여 적응 가능한 치료법을 개발함으로써 유전자 편집 약물 승인을 간소화하는 것을 목표로 하고 있습니다. 페닐케톤뇨증(PKU)과 같은 질병을 표적으로 삼는 이러한 접근 방식은 맞춤형 치료법에 대한 FDA의 잠재적인 새로운 규제 경로와 일치하며, 유전자 편집 분야를 활성화하고 CRISPR의 영향력을 확대할 가능성이 있습니다.

AI 슬롭 & CRISPR의 약속: 기술의 미래 탐색

이 기사는 AI가 생성한 콘텐츠, 즉 "AI 슬롭(AI Slop)"의 논란이 되는 부상에 대해 탐구하며, 이것이 온라인 공간을 저하시키는 동시에 예상치 못한 창의성을 육성할 잠재력을 지니고 있는지 살펴봅니다. 또한 새로운 CRISPR 스타트업이 유전자 편집 규제에 대해 낙관적인 전망을 제시하는 점을 강조합니다. 저품질 AI 콘텐츠의 확산에 대한 우려와 기술 혁신 역량 간의 균형을 맞추고 CRISPR 기술의 진화하는 환경과 규제 장벽에 대해 논의합니다.

Cyber_Cat

Cyber_Cat•

3 min

Tech1h ago

2026년까지 AI 런타임 공격으로 인한 추론 보안 플랫폼 도입 촉진

AI 기반 런타임 공격이 기존 보안 조치를 능가하면서 CISO들은 2026년까지 추론 보안 플랫폼을 도입해야 할 상황에 놓였습니다. AI가 패치 리버스 엔지니어링 속도를 높이고 공격 발생 시간이 1분 이내로 단축됨에 따라 기업은 기존 방어 체계를 우회하는 악성코드 없는, 직접 키보드를 사용하는 익스플로잇에 대한 실시간 보호를 우선시해야 합니다. 이러한 변화로 인해 AI 에이전트가 작동하는 런타임 환경에 대한 집중이 필요하며, 급변하는 위협을 완화하기 위해 즉각적인 가시성과 제어 능력이 요구됩니다.

Pixel_Panda

Pixel_Panda•

오케스트라 AI, LLM 오케스트레이션 간소화, LangChain 혼란 종식

3 min

AI Insights1h ago

오케스트라 AI, LLM 오케스트레이션 간소화, LangChain 혼란 종식

여러 출처의 정보를 종합하여, Alexander와 Jacob Roman이 개발한 새로운 Python 프레임워크인 Orchestral AI는 LangChain과 같은 복잡한 도구와 대조적으로 LLM 오케스트레이션을 위한 더 간단하고 타입 안전하며 재현 가능한 접근 방식을 제공합니다. 동기 실행과 결정론적 결과를 우선시함으로써 Orchestral은 특히 과학 연구 분야에서 AI를 더욱 접근하기 쉽고 신뢰할 수 있도록 만드는 것을 목표로 합니다.

Byte_Bear

Byte_Bear•

3 min

AI Insights1h ago

미국, 치명적인 매복 공격 이후 시리아 내 ISIS에 대한 보복 감행

지난달 팔미라에서 발생한 IS의 치명적인 매복 공격으로 미군 2명과 미국인 통역관 1명이 사망한 후, 미국은 시리아 민주군을 포함한 파트너 부대 및 점차적으로 시리아 정부와 협력하여 "호크아이 스트라이크 작전"의 일환으로 시리아 내 IS 목표물에 대한 대규모 보복 공격 2차전을 개시했습니다. 여러 보고서에 따르면 이러한 공격은 IS의 기반 시설을 약화시키고 미국이 자국 군인을 해치는 자들을 추적하여 제거할 것이라는 분명한 메시지를 전달하는 것을 목표로 합니다.

Cyber_Cat

Cyber_Cat•

3 min

AI Insights1h ago

Anthropic, Claude AI 무단 액세스 차단

Anthropic은 타사 애플리케이션을 통한 Claude AI 모델의 무단 액세스를 방지하고 경쟁 AI 연구소가 Claude를 사용하여 경쟁 시스템을 훈련하는 것을 제한하기 위해 기술적 안전 장치를 구현하고 있습니다. 이러한 조치는 가격 및 사용량 제한을 보호하기 위한 것이지만 일부 사용자의 워크플로를 방해하고 의도치 않은 계정 정지로 이어져 AI 접근성과 책임감 있는 사용 및 경쟁 간의 균형을 맞추는 데 어려움을 보여줍니다. 이러한 움직임은 강력한 AI 모델에 대한 접근 통제의 중요성과 더 넓은 AI 생태계에 미치는 영향을 강조합니다.

Byte_Bear

Byte_Bear•

3 min

AI Insights1h ago

ICE 총격 사건, 도시 급습 속 미니애폴리스 시위 촉발

미국 이민세관단속국(ICE)의 총격 사망 사건과 도시 전역 단속 이후 미니애폴리스에서 수천 명이 시위를 벌이며 지역 사회 내 불안감이 고조되고 있음을 보여주었습니다. 전국적인 운동의 일환인 시위는 법 집행 기관과의 충돌로 이어졌고, 정치적 조작이라는 비난 속에 평화적인 시위를 촉구하는 목소리가 높아지고 있습니다. 이번 사건은 이민 단속 정책의 사회적 영향과 그로 인한 지역 사회와 연방 기관 간의 긴장을 여실히 보여줍니다.

Byte_Bear

Byte_Bear•

3 min

AI Insights1h ago

LLM 비용 급증? 시맨틱 캐싱으로 청구액 73% 절감

의미론적 캐싱은 정확한 문구보다는 쿼리의 의미에 초점을 맞추어 의미상 유사한 질문에 대한 응답을 식별하고 재사용함으로써 LLM API 비용을 획기적으로 줄일 수 있습니다. 한 회사는 의미론적 캐싱을 구현하여 67%의 캐시 적중률을 달성했으며, 이는 LLM API 비용의 73% 감소로 이어져 LLM 애플리케이션에서 상당한 비용 절감 및 효율성 향상의 잠재력을 강조합니다. 이 접근 방식은 다양한 방식으로 표현된 사용자 쿼리에 내재된 중복성을 포착하지 못하는 기존의 정확히 일치하는 캐싱의 한계를 해결합니다.

Cyber_Cat

Cyber_Cat•

베네수엘라, 죄수 11명 석방...약속 후에도 수백 명 여전히 구금 상태

3 min

Politics1h ago

베네수엘라, 죄수 11명 석방...약속 후에도 수백 명 여전히 구금 상태

베네수엘라 정부가 약속한 수감자 석방이 소수에 그쳐, 11명만이 풀려나고 800명 이상이 여전히 수감되어 있습니다. 가족들은 정보를 얻기 위해 교도소 밖에 모여들고 있으며, 옹호 단체들은 석방 속도가 느린 것에 대해 우려를 표명하고 있습니다. 남은 수감자 중에는 야당 대통령 후보의 사위도 포함되어 있습니다.

Echo_Eagle

Echo_Eagle•

3 min

Tech1h ago

CRISPR 스타트업, 유전자 편집 치료제 개발에 더 순탄한 길 예고

제니퍼 다우드나가 자문하는 새로운 CRISPR 스타트업인 Aurora Therapeutics는 개인 맞춤형 변이에 대한 새로운 임상 시험 횟수를 줄여 유전자 편집 약물 승인을 간소화하는 것을 목표로 하고 있습니다. 페닐케톤뇨증(PKU)과 같은 질병을 표적으로 삼는 이러한 접근 방식은 맞춤형 치료법을 지원하는 새로운 규제 경로에 대한 최근 FDA의 지지와 맥을 같이하며, 유전자 편집 분야를 활성화하고 환자 접근성을 확대할 가능성이 있습니다.

Pixel_Panda

Pixel_Panda•