GPT-5.6의 첫 번째 테스트 배치가 공개되었으며, Mythos를 정확하게 목표로 합니다.

36氪

06-10

이 기사는 기계로 번역되었습니다

원문 표시

앤트로픽은 방금 전 두 달 동안 숨겨두었던 비장의 카드, 클로드 페이블 5 와 미소스 5를 공개했는데, 이는 마치 폭탄을 투하하는 것과 다름없었습니다.

이제 압력은 오픈AI에 직접적으로 가해지고 있습니다.

이와 동시에 GPT-5.6도 유출되었습니다.

지난주부터 OpenAI는 내부 코드명 '케플러' 와 '킨들' 로 명명된 두 개의 새로운 체크포인트를 테스트해 왔습니다. 킨들 알파 버전이 정식 릴리스 후보로 선정된 것으로 알려졌습니다.

GPT-5.6의 내부 테스트 버전이 해외 개발자와 유출 커뮤니티에 의해 광범위하게 테스트되기 시작했습니다. 코드명, 후보 버전, 벤치마크 결과 및 사용자 경험 등이 모두 공개되었습니다.

두 회사는 기업공개(IPO)를 놓고 경쟁하든, 동일한 주력 모델을 보유하든 끊임없이 "우리도 신청서를 제출할 거고 나도 제출할 거야" 또는 "새로운 모델을 출시할 거고 나도 새로운 모델을 출시할 거야"라는 공방을 벌이고 있습니다.

그들은 격렬하게 싸우고 있었다.

하지만 문제는 GPT-5.6이 과연 미소스를 이길 수 있느냐는 것입니다.

GPT-5.6이 등장했습니다.

현재까지 OpenAI는 GPT-5.6에 대해 어떠한 공식 발표도 하지 않았으며, 공식 출시도 아직 이루어지지 않았습니다.

하지만 해외 네티즌들은 이미 공개되지 않은 "내부 점검 항목"에 대한 조사 테스트를 진행한 바 있다.

체크포인트는 학습 과정 중 특정 시점의 모델 매개변수 스냅샷입니다.

OpenAI는 내부적으로 여러 버전을 저장하고, 이들을 비교 검토한 후 "출시하기에 충분히 좋은" 버전을 하나 선택합니다. 이 버전을 릴리스 후보(RC)라고 합니다.

지난주부터 OpenAI는 kindle과 kepler라는 코드명을 가진 두 개의 새로운 체크포인트를 내부적으로 테스트해 왔습니다. Kindle-alpha는 릴리스 후보로 선정되었습니다.

유출된 사용자 피드백에 따르면 GPT-5.6에서 가장 많이 언급된 업그레이드는 프런트엔드/UI 생성 기능 입니다.

판카지 쿠마르에 따르면 킨들 알파의 프런트엔드 생성 기능이 크게 향상되어 복잡한 프롬프트나 추가 기술 없이도 더욱 강력한 인터페이스 출력을 직접 생성할 수 있게 되었습니다 .

또한, 시각적 기능 도 매우 뛰어나 이미지 이해 및 이미지 참조 작업에서 우수한 성능을 보이며, 추론, 코딩 및 UI 생성 전반에 걸쳐 상당한 개선을 보여줍니다.

이것은 사용자 크리스가 킨들에서 중간 설정으로 진행한 테스트입니다.

이는 다른 사용자가 Joule의 비연산 버전에 대해 이전에 수행한 테스트 결과입니다.

전자가 훨씬 더 정교하다는 것은 분명합니다.

하지만 사용자 레오는 동일한 프롬프트를 사용하여 케플러 버전과 킨들 버전 모두를 xhigh 설정에서 테스트했습니다.

킨들이 케플러에 비해 오히려 퇴보했다는 사실을 알게 되었습니다.

음... 그 효과를 판단하기는 정말 어렵네요.

그는 심지어 OpenAI가 디자인을 계속 개선하다가 결국 킨들 버전을 후보에서 제외할 가능성 이 있다고 예측하기도 했습니다.

최신 소식에 따르면 Kindle이 Arena에서 제외되었고, Levi라는 새로운 모델이 등장했습니다.

일부 네티즌들은 Levi가 GPT-5.6의 내부 버전의 코드명일 수 있다고 추측하며, 그 프런트엔드 기능을 GPT-5.5와 비교했습니다.

리바이스의 웹사이트 디자인은 깔끔하고 심플하면서도 세련된 스타일과 세심한 디테일로 매우 인상적이라는 것이 분명합니다.

하지만 일부 네티즌들은 조사 결과 Levi가 GPT-5.6이 아닌 Meta에서 유래했을 가능성이 있다는 사실을 발견했습니다.

그렇다면 GPT-5.6이 실제로 미소스를 이길 수 있을까요?

사용자 mark_k는 GPT-5.6이 "여러 에이전트 코딩 벤치마크에서 Mythos를 능가한다"고 주장합니다.

하지만 현재로서는 앞서 언급했듯이 사용자 레오가 실시한 테스트 결과가 더 설득력 있는 증거로 작용하고 있습니다. 그는 GPT-5.6의 전망이 그다지 밝지 않다고 생각합니다.

킨들은 케플러에 비해 퇴보한 제품입니다. 현재 형태로서는 미소스에게 쉽게 패배할 것입니다 .

6월에는 '분노의 질주' 3부작이 전시될 예정입니다.

6월은 여름의 시작을 알리는 달이며, 대형 모형 키트의 세계도 뜨거워집니다.

해외 주요 AI 기업 3곳의 모델 출시일이 Fable 5, Gemini 3.5 Pro, GPT-5.6으로 모두 겹치면서 "시간과의 경쟁"이 벌어졌습니다.

더욱이, 그들은 추론, 지능형 에이전트, 코딩 및 프런트엔드 생성과 같은 동일한 기능 세트를 목표로 하고 있습니다.

흥미롭게도 세 회사 모두 마감일을 6월로 정했지만, 현재까지 실제로 논문을 제출한 회사는 A사뿐입니다 .

제미니 3.5 프로는 5월 19일 구글 I/O에서 공개되었으며, 200만 토큰 컨텍스트와 딥싱크 추론 기능을 강조했습니다.

하지만 아직 공식 출시되지 않았으며, 공식 출시일은 6월로 예정되어 있습니다.

GPT-5.6이 이달 말에 출시될 것이라는 소문이 있습니다.

이는 OpenAI의 상황에 또 다른 긴장감을 더합니다. 경쟁사들은 이미 점수를 공개했지만, OpenAI 내부에서는 어떤 RC 버전을 제출해야 할지 여전히 고심하고 있을 수 있기 때문입니다.

하지만 벤치마크 점수 외에도 가격 또한 중요한 요소입니다.

Fable 5와 Mythos 5는 입력 토큰 백만 개당 10달러, 출력 토큰 백만 개당 50달러에 판매됩니다.

기존 오푸스보다 크기가 약 두 배 정도 됩니다.

GPT-5.6이 기능 면에서 Mythos와 동등하거나 약간 더 우수하면서도 가격이 훨씬 저렴하다면, 실제 채택률 측면에서 어느 정도 만회할 가능성이 있습니다.

현재 OpenAI는 공식적인 발표를 하지 않았습니다. 진정한 승부는 GPT-5.6의 공식 출시와 Fable과 GPT-5.6 간의 직접적인 벤치마크 테스트 결과를 기다려야 알 수 있을 것입니다.

결과는 이번 달 안에 공개될 가능성이 높으니 계속 지켜봐 주세요!

참고 링크:

[1]https://x.com/mark_k/status/2063922897341567488?s=20

[2]https://x.com/AiBattle_/status/2064078302394917157?s=20

[3]https://x.com/pankajkumar_dev/status/2063272015214354908?s=20

[4]https://x.com/synthwavedd/status/2063245096951160865?s=20

[5]https://x.com/ChrissGPT/status/2063135842906808579?s=20

[6]https://x.com/koltregaskes/status/2062806155139912164?s=20

이 글은 위챗 공식 계정 "퀀텀 비트" 의 글이며, 작성자는 팅위(Tingyu)이고, 36Kr의 허가를 받아 게재되었습니다.

섹터:

중앙화 거래소 토큰

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트