실리콘 밸리에 어젯밤 두 개의 폭탄이 투하되었습니다. GPT-5.3-코덱스가 클로드 4.6을 표적으로 삼았습니다. 울트라맨은 몹시 불안해하고 있습니다.

이 기사는 기계로 번역되었습니다

원문 표시

단 하루 만에 두 개의 주요 프로그래밍 AI가 실리콘 밸리를 강타했다. 클로드 오푸스 4.6에 이어 울트라맨이 서둘러 GPT-5.3-코덱스를 출시했다. 이 두 거대 AI의 대결은 AI 왕좌를 차지하기 위한 치열한 경쟁의 막을 올렸다.

실리콘 밸리는 잠 못 이루는 밤을 보낼 것이다!

클로드 오퍼스 4.6은 아무런 예고 없이 한밤중에 기습 공격을 감행하여 울트라맨을 완전히 허를 찔렀다.

이에 대응하여 OpenAI는 단 30분 만에 가장 강력한 지능형 에이전트 프로그래밍 모델인 GPT-5.3-Codex를 신속하게 배포했습니다.

GPT-5.3은 존재하지 않고, GPT-5.3-Codex만 존재합니다!

이 제품은 GPT-5.2-Codex의 최고급 프로그래밍 기능과 GPT-5.2의 뛰어난 추론 및 전문성을 완벽하게 결합했으며, 실행 속도가 25% 향상되었습니다 .

이 시스템은 심층적인 연구, 도구 사용 및 복잡한 실행을 수반하는 장기적인 작업을 손쉽게 처리할 수 있습니다.

GPT-5.3-Codex는 마치 당신 옆에서 함께 일하는 동료와 같아서, 맥락을 잃을 걱정 없이 실시간으로 작업하는 동안 당신이 안내하고 상호 작용할 수 있도록 해줍니다.

GPT-5.3-Codex는 자체 생성 과정에서 핵심적인 역할을 수행한 최초의 모델이라는 점도 언급할 가치가 있습니다.

GPT-5.3-Codex 출시와 함께 Codex의 역할은 질적으로 도약했습니다.

코드 작성 및 검토만 가능했던 AI 에이전트에서, 개발자와 전문가가 컴퓨터에서 할 수 있는 거의 모든 작업을 수행할 수 있는 AI 에이전트로 진화했습니다.

GPT-5.3-Codex가 이제 ChatGPT 유료 플랜에 포함되어 앱, CLI, IDE 확장 프로그램 및 웹을 포함한 모든 Codex 응용 시나리오를 지원합니다.

오늘날 실리콘 밸리는 앤트로픽과 오픈AI라는 두 거대 기업의 경쟁이 치열한 격전지가 되었으며, 긴장감이 감돌고 있습니다.

흥미롭게도, 울트라맨은 원래 자정에 신형 모델 출시를 발표했지만, 앤스로픽이 먼저 출시했습니다.

하룻밤 사이에 가장 강력한 프로그래밍 AI 두 개가 정면 대결을 펼치면서 네티즌들은 " AI의 발전 속도를 따라잡을 수가 없다 "며 불만을 토로했습니다.

향상된 코딩 기능을 제공하는 GPT-5.3-Codex가 출시되었습니다.

GPT-5.3-Codex는 과연 얼마나 강력할까요? 성능 보고서를 보여주시면 알 수 있습니다.

소프트웨어 엔지니어링의 새로운 시작점

GPT-5.3-Codex는 실제 소프트웨어 엔지니어링을 평가하는 SWE-Bench Pro 벤치마크에서 업계 최고 기록을 경신했습니다.

동시에, 지능형 에이전트 프로그래밍의 터미널 성능을 측정하는 Terminal-Bench 2.0 에서 해당 소프트웨어는 이전 최고 성능(SOTA)을 훨씬 뛰어넘는 성능을 보여주었습니다.

주목할 만한 점은 GPT-5.3-Codex가 이전의 어떤 모델보다 훨씬 적은 토큰을 사용하여 이 모든 것을 달성한다는 것입니다.

파이썬만 테스트하는 SWE-bench Verified와 달리 SWE-Bench Pro는 4개 언어를 지원하므로 데이터 손상에 대한 저항력이 높을 뿐만 아니라 더욱 까다롭고 다양하며 산업 관련성이 높습니다.

게임을 처음부터 만들기

최첨단 프로그래밍 기능, 미적 개선 및 컴팩트함을 결합한 GPT-5.3-Codex는 놀라운 결과를 제공하며, 매우 복잡한 게임과 애플리케이션을 단 며칠 만에 처음부터 구축할 수 있도록 해줍니다.

OpenAI는 모델의 웹 개발 및 장기 에이전트 기능을 테스트하기 위해 GPT-5.3-Codex에게 두 가지 게임을 제작하도록 했습니다.

코덱스 앱에서 레이싱 게임과 다이빙 게임의 두 번째 버전을 출시했습니다.

웹 게임 개발에 사용된 기술과 미리 선택된 일반적인 후속 지시문(예: "버그 수정" 또는 "게임 개선")을 활용하여 GPT-5.3-Codex는 수백만 번의 토큰 상호 작용을 통해 게임을 자율적으로 반복 개발했습니다.

레이싱 게임: 다양한 레이서, 8개의 맵, 그리고 스페이스바를 눌러 발동할 수 있는 파워업 아이템까지 포함되어 있습니다.

다이빙 게임: 플레이어는 다양한 산호초를 탐험하고, 산호를 수집하여 물고기 도감을 완성하고, 산소량을 관리할 수 있습니다.

• 당신의 의도를 더 잘 이해하세요

GPT-5.2-Codex와 비교했을 때, GPT-5.3-Codex는 일상적인 웹사이트 제작에 사용할 때 사용자의 의도를 더욱 정확하게 파악할 수 있습니다.

간단하거나 모호한 요청의 경우, 이제 기본적으로 더 풍부한 기능과 뛰어난 디자인을 갖춘 웹사이트를 생성하여 더 나은 시작점을 제공하고 아이디어를 실현하는 데 도움을 줍니다.

· GPT-5.3-Codex vs GPT-5.2-Codex

예를 들어, GPT-5.3-Codex와 GPT-5.2-Codex 모두에게 랜딩 페이지를 만들도록 요청할 수 있습니다.

GPT-5.3-Codex는 연간 요금제를 할인된 월별 가격으로 자동 표시하여, 단순히 연간 총액을 계산하는 것보다 할인율이 명확하고 보기 좋게 표시되도록 합니다.

또한, 단조로운 단일 사용자 후기 대신 세 가지 다른 사용자 후기가 자동으로 바뀌는 캐러셀을 생성했습니다. 이를 통해 페이지가 기본적으로 더 완성도 높게 보이며, 마치 바로 출시할 수 있는 제품처럼 느껴집니다.

GPT-5.3-코덱스

GPT-5.2-코덱스

프롬프트 단어:

Quiet KPIs의 랜딩 페이지를 제작하세요. Quiet KPIs는 창업자 친화적인 주간 성과 요약 도구입니다. 부드러운 SaaS 스타일을 채택하여 유리처럼 투명한 카드, 연보라색에서 파란색으로 이어지는 그라데이션, 은은한 흐림 효과를 적용했습니다. 페이지 구성은 다음과 같습니다: 이메일 수집 기능이 있는 홈 화면, 샘플 보고서 그리드, 통합 목록 행, 고객 후기 캐러셀, 월간/연간 요금제 전환, FAQ, 그리고 푸터.

• Satoshi 또는 이와 유사한 기하학적 산세리프 글꼴을 사용하십시오.

• 버튼은 14px 반경의 둥근 모서리를 사용하여 강한 집중 효과를 줍니다.

• 세련된 스크롤 기반 표시 효과를 추가합니다.

프로그래밍의 일반적인 기능을 넘어서

소프트웨어 엔지니어, 디자이너, 제품 관리자, 데이터 과학자는 단순히 코드를 생성하는 것 이상의 훨씬 더 많은 일을 합니다.

GPT-5.3-Codex는 디버깅, 배포, 모니터링, PRD 작성, 문서 편집, 사용자 조사, 테스트 및 메트릭과 같은 소프트웨어 수명주기의 모든 단계를 지원합니다.

게다가 이 프로그램은 사용자가 원하는 모든 것을 만들 수 있도록 지원합니다. 아름다운 슬라이드를 제작하는 것부터 스프레드시트에서 복잡한 데이터 분석을 수행하는 것까지 가능합니다.

전문성 측정 지표인 GDPval에서 GPT-5.3-Codex는 GPT-5.2와 동등한 수준으로 매우 뛰어난 성능을 보였습니다.

1. 재정 자문 슬라이드

2. 소매업 교육 자료

3. 순현재가치(NPV) 분석 스프레드시트

4. 패션 프레젠테이션 PDF

• 컴퓨터 활용 능력

OSWorld는 시각화된 데스크톱 컴퓨터 환경에서 생산성 작업을 수행하는 에이전트를 요구하는 컴퓨터 사용 벤치마크입니다.

여기서 GPT-5.3-Codex는 이전 GPT 모델들을 훨씬 뛰어넘는 컴퓨터 연산 능력을 보여줍니다.

OSWorld-Verified에서 해당 모델은 시각 정보를 사용하여 다양한 컴퓨터 작업을 완료했습니다(인간의 점수는 약 72%였습니다).

요약하자면, 프로그래밍, 프런트엔드, 컴퓨터 운영 및 실제 작업에서 나타난 이러한 우수한 성능 결과는 GPT-5.3-Codex가 개별 작업에서 더 나은 성능을 보일 뿐만 아니라 단일 범용 지능형 에이전트를 향한 중요한 진전을 나타낸다는 것을 입증합니다.

이는 지능형 에이전트가 이제 실제 기술 작업의 모든 측면에서 추론, 구성 및 실행할 수 있음을 의미합니다.

협업 운영과 중간에 중단할 수 있는 능력.

모델의 성능이 향상됨에 따라, 당면 과제는 "지능형 에이전트가 무엇을 할 수 있는가"에서 "인간이 병렬로 작동하는 여러 지능형 에이전트와 쉽게 상호 작용하고, 명령하고, 감독하는 방법"으로 바뀌었습니다.

GPT-5.3-Codex의 지원으로 운영 프로세스가 더욱 자주 업데이트될 예정입니다.

이러한 방식으로 개발자는 작업 중 언제든지 주요 결정 사항과 진행 상황을 추적할 수 있습니다.

최종 결과를 기다릴 필요 없이 실시간으로 소통하며 질문하고, 방법을 논의하고, 해결책을 향해 나아갈 수 있습니다.

GPT-5.3-Codex는 작동 방식을 설명하고, 사용자의 피드백에 응답하며, 시작부터 끝까지 동기화 상태를 유지합니다.

자체 가속 반복, 연구 개발 워크플로우를 장악하다

현행 코덱스는 여러분의 의도를 이해하고 있으며, 더 중요한 것은 효율성을 중시한다는 점입니다.

OpenAI 내부에도 일종의 "중첩된" 진화 과정이 있는데, Codex는 자체적인 개발을 가속화하고 있습니다.

OpenAI의 연구원과 엔지니어들은 단 두 달 만에 자신들의 업무 방식이 완전히 혁신되었다는 사실을 발견했습니다.

그들은 현재 공식 버전을 학습, 배포 및 최적화하기 위해 GPT-5.3-Codex의 초기 버전을 사용하고 있습니다.

이러한 "자기 진화"의 물결이 가져오는 실질적인 결과는 매우 폭발적입니다.

연구팀

Codex는 교육 운영 모니터링 및 상호 작용 패턴 분석부터 동료를 위한 분석 도구 개발에 이르기까지 전체 프로세스에 참여하여 버그를 수정했을 뿐만 아니라 제안도 제공했습니다.

엔지니어링 팀

가장 믿음직한 아군입니다. 테스트 프레임 최적화, 캐시 오류의 근본 원인 파악, 트래픽 급증 시 GPU 클러스터의 동적 스케줄링 등 어떤 작업을 하든 안정적인 성능을 유지합니다.

실제 알파 테스트 사례

생산성 차이를 이해하기 위해 Codex는 자체 정규 표현식 분류기를 작성하고, 방대한 양의 로그를 분석하여 정확한 보고서를 직접 생성했습니다.

직관에 반하는 데이터 대면, 코덱스는 데이터 과학자들과 협력하여 새로운 파이프라인을 구축했습니다. 사람이 직접 한다면 몇 시간이나 걸릴까요? 코덱스는 단 3분 만에 수천 개의 데이터 포인트에서 핵심적인 통찰력을 추출했습니다.

그는 단순한 프로그래머를 넘어 다재다능한 트레이더입니다.

GPT-5.3-Codex의 야망은 이미 코드 박스를 훨씬 넘어섰습니다.

이번 릴리스를 통해 Codex는 단순한 코딩 도구에서 컴퓨터 운영 및 작업 완료를 위한 강력한 지원 도구로 변모합니다.

OpenAI는 소프트웨어 개발부터 심층 연구, 복잡한 분석, 심지어 각종 사무 업무에 이르기까지 더욱 광범위한 영역을 개척하고 있습니다.

한때 그 목표는 "가장 강력한 프로그래밍 가능한 지능형 에이전트"가 되는 것이었지만, 이제는 컴퓨터 안에서 전지전능한 "만능 협력자"가 되었습니다.

코덱스의 적용 범위는 무한히 확장되었으며, 우리의 창의력의 한계는 완전히 새롭게 재정립될 것입니다.

참고 자료:

https://openai.com/index/introducing-gpt-5-3-codex/

https://x.com/OpenAI/status/2019474152743223477

https://x.com/sama/status/2019474754529321247

이 글은 위챗 공식 계정 "신지위안" 의 글이며, 작성자는 신지위안이고, 36Kr의 허가를 받아 게재되었습니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트