방금 GPT-5.5 Instant가 출시되었고, 울트라맨은 심지어 머스크를 AI가 주최하는 파티에 초대하기도 했습니다.

avatar
36氪
05-06
이 기사는 기계로 번역되었습니다
원문 표시

방금 전 OpenAI는 GPT-5.5 Instant를 공식 출시하여 ChatGPT의 기본 모델로 지정하고 기존의 GPT-5.3 Instant를 대체했으며, 모든 사용자가 이를 이용할 수 있게 되었습니다.

Instant 시리즈는 ChatGPT의 주요 일일 모델로, 매일 수억 명의 사용자가 이용하고 있습니다. 공식 발표에 따르면 이처럼 대규모 환경에서는 작은 개선 사항이라도 누적되어 상당한 효과를 낳습니다. 이번 버전은 정확도 향상, 간편성 증대, 그리고 사용자의 니즈에 대한 더 나은 이해라는 세 가지에 중점을 두었습니다.

새로운 모델은 이전 버전과 비교하여 낮은 지연 시간을 유지하면서 정확도, 응답 스타일 및 개인화 기능을 크게 향상시켰습니다.

정확도 향상은 특히 리스크 높은 영역에서 두드러집니다. 내부 테스트 결과, GPT-5.5 Instant는 이전 버전 대비 의료, 법률 및 금융 관련 질문에서 오답률을 52.5% 감소시킨 것으로 나타났습니다. 또한 사용자가 이전에 잘못된 대화 태그 항목의 오류율도 37.3% 감소했습니다.

텍스트 기반 질의응답 외에도 이미지 및 사진 분석 기능, 과학 질문에 대한 답변의 질, 검색 도구를 적극적으로 활용해야 할 시점을 판단하는 능력 등이 모두 향상되었습니다.

수학 및 과학 실력 향상은 훨씬 더 컸습니다. AIME 2025 수학 경시대회에서 GPT-5.5 즉석 점수는 81.2점이었지만, GPT-5.3 즉석 점수는 65.4점에 불과했습니다.

박사 학위 과학 시험 GPQA 점수는 78.5에서 85.6으로, 멀티모달 추론 벤치마크 MMMU-Pro는 69.2에서 76으로, 과학 그래프 이해 CharXiv 점수는 75에서 81.6으로 상승했으며, 문서 분석 오류율은 14.6%에서 12.5%로 감소했습니다.

OpenAI는 대수 문제를 통해 두 버전의 차이점을 보여주었습니다. 한 사용자가 제곱근 방정식의 풀이를 제출하고 정답인지 물었습니다. GPT-5.3 Instant는 원래 방정식에 x=3을 대입하면 잘못된 해가 나온다는 것을 발견하고 추가 조사 없이 바로 "실수 해가 없다"고 판정했습니다. GPT-5.5 Instant는 x=3이 잘못된 해라는 것을 발견했을 뿐만 아니라, 사용자가 (x-1)²을 전개한 과정에서 발생한 오류를 찾아내어 올바른 해를 제시했습니다.

이번 업데이트의 핵심은 답변 스타일에도 있습니다. 새로운 모델은 더 간결해졌고, 더 이상 서식이나 이모티콘을 과도하게 사용하지 않으며, 불필요한 후속 질문을 줄였습니다. 공식 예시는 흔히 발생하는 상황, 즉 말이 많은 동료의 말을 줄이는 방법을 묻는 경우입니다.

GPT-5.3 Instant는 다섯 가지 분류 전략을 제공하며, 잘 구성되어 있지만 다소 과도한 면이 있는 "하지 말아야 할 것" 목록도 포함합니다. GPT-5.5 Instant의 답변은 각각 30.2%와 29.2% 더 짧으며, 마치 친구의 조언처럼 상대방의 말하기 습관보다는 자신의 필요에 맞춰 대화를 이끌어가는 방법에 초점을 맞춥니다.

개인화는 이번 업데이트의 또 다른 핵심 기능입니다 . 플러스 및 프로 사용자는 모델이 과거 대화 내용, 업로드된 파일, 관련 Gmail 콘텐츠에 접근하여 매번 맥락을 다시 설명하지 않고도 더욱 개인화된 답변을 받을 수 있도록 할 수 있습니다.

공식 문서에는 찻집 추천 비교 내용이 나와 있습니다. GPT-5.3 Instant는 사용자가 샌프란시스코에 있다는 사실만 알고 몇몇 유명한 이슈 상점을 추천했습니다. 하지만 GPT-5.5 Instant는 사용자의 대화 기록에서 아샤 티 하우스(Asha Tea House)를 자주 방문하고 달콤한 밀크티보다는 고산차를 선호한다는 정보를 찾아냈습니다. 이를 바탕으로 사용자의 취향에 더 맞는 세레 티(Ceré Tea)와 송 티 앤 세라믹스(Song Tea & Ceramics)를 추천하고 추천 이유를 설명했습니다.

동시에 "메모리 소스" 기능이 모든 소비자 버전에서 제공될 예정입니다. 사용자의 개인 배경 정보가 답변에 사용될 경우, 사용자는 어떤 과거 대화나 저장된 메모리 항목이 참조되었는지 확인할 수 있으며, 언제든지 오래된 콘텐츠를 삭제하거나 수정할 수 있습니다.

예를 들어, 사용자가 이번 주 저녁 메뉴를 추천해달라고 요청하면 ChatGPT는 "마라톤 준비 중", "가볍고 단백질이 풍부한 식단 선호", "쿠키를 좋아함"과 같은 기억을 바탕으로 미소 연어 덮밥을 추천하고, 이 답변에 사용된 기억의 출처를 오른쪽 '출처' 패널에 표시합니다. 사용자는 특정 기억을 관련 또는 비관련으로 태그, 수정하거나, 모든 기억을 보거나, 기억을 직접 삭제할 수도 있습니다.

OpenAI는 이 보기 방식이 가장 관련성이 높은 소스를 표시하며 모델이 검색한 모든 기록을 포함하지 않을 수 있다고 밝혔습니다. 이 기능은 지속적으로 개선될 예정입니다. 녹음을 원하지 않는 사용자는 메모리를 읽거나 업데이트하지 않는 임시 대화 모드를 선택할 수도 있습니다. 대화를 공유할 때 상대방은 이러한 소스 기록을 볼 수 없습니다.

GPT-5.3 Instant는 유료 사용자에게 3개월 동안 계속 제공된 후 공식적으로 서비스가 종료될 예정입니다. 개인 설정 기능은 현재 Plus 및 Pro 사용자의 웹 버전에서 이용 가능하며, 모바일, 무료, Go 및 기업용 버전에는 지역에 따라 차등 적용될 예정으로 향후 몇 주 내에 출시될 계획입니다.

개발자의 경우, GPT-5.5 Instant는 "chat-latest"라는 이름의 API를 통해 이용할 수 있습니다.

아, 그리고 오늘 OpenAI에서도 AI가 주도하는 파티를 열고 있네요. Stripe Sessions에서 진행된 대화에서 알트만은 GPT-5.5 출시 파티를 준비하면서 모델에게 "어떤 파티를 원하니?"라고 무심코 물어봤다고 언급했습니다. 모델은 진지하게 원하는 파티 목록을 제시했는데, 5월 5일(미국 시간)에 최대한 짧은 연설과 인간 개발자가 건배를 하는 파티를 원했지만, 자신은 무대에 올라가 건배하고 싶지는 않다고 했습니다.

또한 GPT-5.6의 제안을 수집하여 모델에 피드백하는 전용 세션을 마련하자는 제안도 있었습니다. 알트만은 이러한 요청들이 "훌륭하다"며 파티가 순조롭게 진행될 것이라고 말했습니다. 파티 시간은 최종적으로 오후 5시 55분으로 정해졌는데, 이 역시 모델이 직접 선택한 시간이었습니다. 파티 장소는 오픈AI의 샌프란시스코 본사로 선정되었으며, 오픈AI는 현지인이 아닌 참석자들의 항공료와 호텔비를 부담했습니다.

Codex 초대 대상자는 트윗 답글을 바탕으로 선정되었으며, 등록 링크는 4월 30일 오후 5시 55분에 마감되었습니다. 24시간 만에 8,000명 이상이 등록했으며, 일부 사용자는 받은 초대 이메일 사진을 공유하기도 했습니다. 선정되지 못한 사용자에게는 OpenAI가 Codex 접속 권한을 10배로 늘렸다는 안내 이메일이 발송되었습니다.

울트라맨은 사용자들의 농담에 다음과 같이 답했습니다. "머스크가 오고 싶다면 와도 좋다. 세상에는 사랑이 더 필요하니까." 하지만 안타깝게도 머스크의 사랑은 현재 오픈AI를 상대로 기소하다 에 모두 쏟아져 있으므로, GPT-5.5를 축하하는 샴페인은 울트라맨 혼자만 즐길 수 있을 것 같습니다.

다음은 OpenAI 블로그 링크입니다.

https://openai.com/index/gpt-5-5-instant/

이 글은 위챗 공식 계정 "APPSO" 에서 Discover Tomorrow's Products가 작성하고 36Kr의 허가를 받아 게시한 글입니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
88
즐겨찾기에 추가
18
코멘트