OpenAI가 GPT-5.2를 출시했습니다. 이 버전을 통해 미니 게임과 인사말 카드 제작이 가능해져 기업 사용자들은 주당 최대 10시간의 업무 시간을 절약할 수 있습니다.

12-12

이 기사는 기계로 번역되었습니다

원문 표시

오픈아이(OpenAI)는 12월 12일 GPT-5.2를 출시하며 , 이를 "전문 지식 업무"에 가장 적합한 AI 모델 시리즈로 소개했습니다. 공식 발표에 따르면 GPT-5.2는 프레젠테이션, 스프레드시트, 코드, 장문 문서 분석 등 실질적인 업무 결과물을 직접 생성할 수 있으며, 다양한 도구와의 연동 및 다단계 작업 처리를 지원합니다. 또한 웹 게임이나 인사말 카드 제작도 가능합니다. 사용자 피드백에 따르면 ChatGPT를 사용하는 기업 고객은 하루 평균 40~60분의 업무 시간을 절약할 수 있으며, 숙련된 사용자는 주당 10시간 이상을 절약할 수 있다고 합니다. GPT-5.2는 생산성 향상을 위한 핵심 버전으로 평가받고 있습니다.

다양한 전문가 사용 시나리오를 완벽하게 충족하기 위해 세 가지 버전이 동시에 출시되었습니다.

OpenAI는 GPT-5.2가 Instant, Thinking, Pro의 세 가지 버전으로 출시될 예정이며, 각각 일상적인 효율성, 심층 추론, 고난이도 문제 해결 능력에 중점을 두고 있다고 밝혔습니다. ChatGPT 애플리케이션에서는 GPT-5.2를 유료 플랜 사용자에게 우선적으로 제공할 예정입니다. API 플랫폼은 개발자들에게 완전히 개방되어 있습니다.

전문 역량이 크게 향상되어 GDPval의 인간 전문가 수준에 처음으로 도달했습니다.

OpenAI는 GPT-5.2 Thinking이 GDPval 직업 지식 평가에서 중요한 돌파구를 마련했다고 지적합니다. 이 평가는 9개 산업 분야의 44개 직종을 대상으로 하며, 모델은 프레젠테이션, 스프레드시트, 일정표, 비즈니스 문서와 같은 결과물을 직접 생성해야 합니다.

결과에 따르면 GPT-5.2 Thinking은 70.9%의 작업에서 업계 전문가보다 뛰어나거나 동등한 성능을 보였으며, 생산 속도는 인간 전문가보다 11배 빠르고 비용은 1% 미만이었습니다. 이로써 GPT-5.2 Thinking은 인간 전문가 수준에 도달하거나 이를 능가한 최초의 OpenAI 모델이 되었습니다.

실무 능력이 전반적으로 향상되었으며, 프로젝트 성과 및 프로그램 개발 능력도 동시에 강화되었습니다.

실제 적용 사례에서 GPT-5.2 Thinking은 전문 컨설턴트 및 분석가에 가까운 논리로 더욱 완벽한 프레젠테이션 및 스프레드시트 구조를 제공하며, 인적 자원 계획, 지분 구조, 프로젝트 관리와 같은 복잡한 작업도 처리할 수 있습니다. 투자 은행 수준의 스프레드시트 작업에서 이전 세대보다 약 9% 향상된 성능을 보여줍니다.

소프트웨어 개발 분야에서 GPT-5.2 Thinking은 SWE-Bench Pro 실세계 코드 수정 테스트에서 56%의 정확도를 달성했습니다. 코드 저장소를 직접 읽고 엔지니어링 문제를 이해하여 사용 가능한 패치를 생성할 수 있습니다.

(참고: SWE-Bench Pro는 "실제 소프트웨어 엔지니어링 작업"을 시뮬레이션하는 테스트로, AI가 이론적인 질문에 답하는 것뿐만 아니라 실제 프로젝트에서 프로그래밍 문제를 직접 해결해야 합니다.)

신뢰성과 통합성이 향상되었으며, 대용량 파일, 이미지 및 도구에 대한 협업이 더욱 성숙해졌습니다.

OpenAI는 GPT-5.2 Thinking의 응답 오류율이 이전 버전보다 약 30% 낮다고 밝혔습니다. MRCRv2 벤치마크에서 수십만 단어에 달하는 매우 긴 문서 대면 거의 완벽한 정확도를 유지하여 계약서, 재무제표, 녹취록 분석에 적합합니다.

이미지 이해 측면에서 GPT-5.2는 차트 및 소프트웨어 인터페이스 해석 오류율을 크게 줄였습니다. 도구 호출 기능 측면에서는 Tau2 벤치마크 테스트에서 98.7%의 정확도를 달성했으며, 다양한 시스템과 여러 단계에 걸쳐 전체 작업 프로세스를 안정적으로 완료할 수 있습니다.

GPT-5.2는 프런트엔드 웹 페이지, 미니 게임 등을 제작하는 데에도 사용할 수 있습니다.

(참고: MRCRv2는 매우 긴 콘텐츠 내에서 핵심 정보를 정확하게 파악하고 여러 번의 추론 과정에서 문맥 혼동을 피하는 AI의 능력을 평가하기 위해 특별히 설계된 테스트입니다. Tau2-bench는 실제 고객 서비스 및 업무 프로세스를 시뮬레이션하는 평가 도구로, AI가 도구를 정확하게 호출하고, 정보를 통합하고, 여러 차례의 상호 작용을 통해 전체 작업을 완료할 수 있는지 테스트하는 데 사용됩니다.)

이 기사, "OpenAI의 새로운 GPT-5.2: 미니 게임과 인사말 카드 제작 가능, 기업 사용자 주당 10시간의 업무 시간 절약"은 ABMedia 에 처음 게재되었습니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트