GPT-5.3이 코덱스에 출시되었고, 오픈AI는 클로드의 새로운 모델에 단 15분 만에 응답했습니다.

36氪

이 기사는 기계로 번역되었습니다

원문 표시

화성과 지구의 충돌, 새로운 전쟁 모델!

클로드 오푸스 4.6 출시 15분 만에 오픈아이언은 최신이자 가장 강력한 프로그래밍 모델을 공개했습니다.

GPT-5.3-코덱스.

가장 먼저 드는 생각은 이 새로운 모델이 드디어 미적인 감각을 갖췄다는 것이다.

공식 웹사이트에는 레이싱 게임과 다이빙 게임, 두 가지 데모 버전이 공개되어 있었습니다. 두 게임 모두 상당히 멋있었습니다.

GPT-5.3-Codex는 사람의 개입 없이 이러한 게임을 끊임없이 반복하며 수백만 개의 토큰을 축적했다고 전해집니다.

웹 개발에서는 보기 좋은 사용자 인터페이스뿐만 아니라 "사용자 의도"에 대한 더 깊은 이해가 필요합니다.

프롬프트가 불분명하더라도 자동으로 논리를 완성하고 완벽하게 작동하는 웹사이트를 생성할 수 있습니다.

이 데모들을 보면 디자인이 이전보다 훨씬 좋아진 것은 확실합니다.

이 제품의 컴퓨터 활용 능력 또한 최고 수준이며, 이제 금융 전문가들이 파워포인트 프레젠테이션을 직접 제작하는 데에도 사용할 수 있습니다.

이 컴퓨터는 특히 전문 지식이 필요한 다른 직장 업무도 처리할 수 있으며, 문서 작성이나 스프레드시트 제작에도 전혀 문제가 없습니다.

물리적 전력 측면에서 공식적인 주요 내용은 다음과 같습니다.

더 스마트한 성능: SWE-Bench Pro 57%, TerminalBench 2.0 76%, OSWorld 64%.

더욱 향상된 제어 기능: 작업 실행 중 실시간 안내를 지원하여 언제든지 방향을 조정하고 업데이트할 수 있습니다.

더 빠른 속도: 동일한 작업을 완료할 때 5.2-Codex 버전보다 절반 이하의 토큰만 필요하므로 토큰당 속도가 25% 이상 향상됩니다.

모어 에이전트: 그들은 코딩 실력이 뛰어날 뿐만 아니라 컴퓨터 운영 능력도 매우 뛰어납니다.

이 비교표를 직접 살펴보면 훨씬 직관적으로 이해할 수 있을 것입니다. 거의 모든 면에서 이전 세대보다 크게 개선되었음을 알 수 있습니다.

네티즌들은 어제 앤트로픽이 광고를 통해 오픈AI를 공격했는데, 오늘 오픈AI가 반격에 나선 것이 너무나 흥미진진하다며 환호했습니다.

하루에 두 명의 거물급 프로그래밍 모델을 만났습니다 .

댓글란은 금세 인류공학 지지파와 오픈AI 지지파로 나뉘었다.

울트라맨이 촉발한 이번 AI 코딩 전쟁에서 오픈AI가 어떤 성과를 거두었는지 살펴보겠습니다.

GPT 5.3 코덱스

물론 모든 사람들이 가장 중요하게 생각하는 것은 프로그래밍 능력입니다.

OpenAI는 GPT-5.3-Codex가 SWE-Bench Pro 에서 최첨단(SOTA) 성능을 달성했다고 밝혔습니다.

이 시험은 실제 소프트웨어 엔지니어링 환경을 위해 특별히 설계되었으며, 네 가지 프로그래밍 언어를 다룹니다. 난이도가 높고, 다양한 유형의 문제가 포함되어 있으며, 실제 운영 환경과 더욱 유사합니다.

한편, GPT-5.3-Codex는 Terminal-Bench 2.0에서도 성능이 크게 향상된 것으로 나타났습니다.

더욱 중요한 것은 효율성입니다. GPT-5.3-Codex는 이러한 결과를 달성하면서 이전의 어떤 모델보다 적은 토큰을 사용했습니다 .

프로그래밍 기능 외에도 차세대 코덱스의 또 다른 핵심 초점은 컴퓨터 활용 입니다.

OSWorld는 지능형 에이전트의 컴퓨터 사용 벤치마크 도구로, 모델이 시각화된 데스크톱 컴퓨터 환경에서 다양한 생산성 작업을 수행해야 합니다.

결과에 따르면 GPT-5.3-Codex는 컴퓨터 사용 능력 측면에서 이전 GPT 모델보다 훨씬 강력한 것으로 나타났습니다.

요약하자면, GPT-5.3-Codex는 단일 모델 기능의 획기적인 발전이 아니라, 지능형 에이전트를 기반으로 코딩, 프런트엔드 개발 및 컴퓨터 운영 측면에서 개선이 이루어진 포괄적인 개발 입니다.

더욱 흥미로운 점은 이번에 GPT-5.3-Codex가 자체 훈련 과정에 직접 참여했다는 것입니다.

OpenAI는 이번 모델이 "자체 가속"에 참여하는 첫 번째 모델이라고 밝혔습니다. Codex 팀은 개발 과정에서 모델의 초기 버전을 사용하여 자체 학습 프로세스를 디버깅하고, 배포를 관리하고, 테스트 결과를 평가했습니다.

공식 자료에서는 몇 가지 구체적인 사례도 제시했습니다.

훈련 단계 에서 연구팀은 Codex를 사용하여 훈련 작업을 모니터링하고 디버깅했으며, 이를 통해 훈련 과정 전반에 걸쳐 모델 동작의 변화를 추적하고, 상호 작용에 대한 심층 분석을 수행하고, 개선 솔루션을 제안할 수 있었습니다.

데이터 분석 측면에서 , 데이터 과학자는 GPT-5.3-Codex와 협력하여 새로운 데이터 파이프라인을 구축하고 기존 대시보드 도구를 훨씬 뛰어넘는 방식으로 결과를 시각화했습니다.

연구원들은 Codex를 사용하여 결과를 분석했고, 해당 모델은 3분도 채 안 되는 시간에 수천 개의 데이터 포인트에서 핵심적인 통찰력을 추출했습니다.

엔지니어링 팀은 Codex를 사용하여 GPT-5.3-Codex에 맞는 테스트 및 런타임 프레임 최적화하고 적용했습니다.

사용자 경험에 영향을 미치는 비정상적인 예외 상황이 발생하기 시작했을 때, 팀 구성원들은 Codex를 사용하여 컨텍스트 렌더링과 관련된 결함을 찾아냈고, 더 나아가 캐시 적중률이 낮은 원인을 추적했습니다.

두 가지 더

Anthropic과의 대결은 확실히 흥미진진했지만, OpenAI는 주목할 만한 다른 두 가지 중요한 행보를 보였습니다.

1. 프론티어: 기업이 "AI 동료"를 만들 수 있도록 지원하는 플랫폼

이는 OpenAI에게 있어 중요한 B2B 업무 이며, 명확한 목표는 에이전트를 기업의 업무 흐름에 완전히 통합하는 것입니다.

구체적인 구현 방법에는 공유된 맥락, 실습 중심의 온보딩 가이드, 피드백을 통한 실습 학습, 명확한 권한 및 경계 설정이 포함됩니다.

HP, Intuit, Oracle, State Farm, Thermo Fisher, Uber와 같은 유명 기업들이 이미 Frontier를 도입한 것으로 알려져 있습니다.

2. AI4S: OpenAI와 Ginkgo는 GPT-5를 사용하여 단백질 합성 비용을 40% 절감하기 위해 협력했습니다.

이 회사는 합성 생물학을 연구하는 실험실 기반 기업입니다. 이들은 GPT-5를 자율 실험실에 연결하여 모델이 실험 계획을 제안하고, 대규모 실험을 실행하고, 결과를 통해 학습하고, 다음에 시도할 것을 결정함으로써 폐쇄 루프를 완성할 수 있도록 했습니다.

2026년은 AI4S가 가속화된 속도로 진화하는 해가 될지도 모릅니다.

하지만 오픈AI가 앤스로픽과 치열한 공방을 벌이고 네티즌들이 일련의 새로운 개발 소식에 열광하는 동안, 댓글란에는 또 다른 목소리가 들려온다.

내 40달러 돌려줘!

울트라맨 측은 울트라맨 40이 철수 된 사실에 대해 아직까지 아무런 반응을 보이지 않고 있다.

어쩌면 그들은 인류와 싸우느라 너무 바빴을지도 모릅니다.

참고 링크:

[1]https://openai.com/index/introducing-gpt-5-3-codex/

[2]https://openai.com/index/introducing-openai-frontier/

[3] https://x.com/i/trending/2019496485793198148

이 글은 위챗 공식 계정 "퀀텀 비트" 에서 가져온 것으로, 저자는 최첨단 기술에 중점을 두고 있으며, 36Kr의 허가를 받아 게시되었습니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트