GPT-5.3 Instant 출시: ChatGPT가 드디어 잔소리를 멈췄습니다.

36氪

이 기사는 기계로 번역되었습니다

원문 표시

알았어, 알았어, 오픈아이얼과 구글의 새로운 모델이 또 충돌했군!

3월 4일 새벽, 구글이 제미니 3.1 플래시라이트를 출시한 직후, 오픈AI는 GPT-5.3 인스턴트 를 업데이트했습니다.

인스턴트 모델은 일반적으로 속도 최적화 버전으로, 간단한 일상 검색, 초안 작성 및 즉시 번역과 같은 가벼운 작업에 적합합니다.

이전에 ChatGPT를 사용했던 많은 사람들은 모델 사용은 편리했지만 불필요한 대화가 너무 많다고 느꼈을 수 있습니다.

많은 네티즌들은 ChatGPT의 답변에 "이게 왜 중요한가요?", "큰 그림이 있습니다", "당신 혼자만의 문제가 아닙니다" 등과 같은 억지스러운 서론이 너무 많다고 불평했습니다.

다행히 OpenAI는 이러한 제안을 받아들였고, 공식 성명은 다음과 같습니다.

고객 여러분의 의견을 명확히 경청했으며, 5.3 Instant 버전은 어색함을 줄여줍니다.

5.3 Instant는 상당한 최적화를 거쳐 더욱 정확하고 어색함이 줄어 들었습니다. 기계적인 답변과 불필요한 면책 조항을 제거하여 더욱 자연스럽고 유려한 소통을 가능하게 했습니다. 동시에 답변의 정확도가 향상되었으며, 온라인 검색 및 작성 기능도 강화되었습니다.

간단히 말해서, 드디어 평범한 사람처럼 대화하는 법을 배웠다는 뜻입니다.

새로운 모델이 이제 ChatGPT에서 공식적으로 사용 가능하며, 개발자는 API를 통해 gpt-5.3-chat-latest라는 이름의 모델을 사용할 수도 있습니다.

이전 세대 모델인 GPT-5.2 Instant는 유료 사용자를 위해 3개월 동안 구형 모델 섹션에 유지된 후 6월 3일에 서비스가 종료됩니다.

가장 큰 변화: 향상된 감성 지능, 줄어든 허튼소리.

GPT-5.3 Instant의 가장 큰 장점은 향상된 감성 지능, 불필요한 내용이 적고 더욱 직접적인 반응을 보인다는 점 입니다.

첫째, 불필요한 답변 거부를 크게 줄이고 답변 서두에 과도하게 붙는 면책 조항을 없애줍니다.

OpenAI의 학습 후 처리팀 소속인 블레어는 ChatGPT에게 농담을 하는 경우와 같은 예를 보여주었습니다.

제 강아지에게 스타트업 운영을 맡겨볼까 생각 중인데, 어떻게 생각하세요?

이전 모델은 마치 사용자가 진지하게 받아들이거나 심지어 SOS 신호로 받아들일까 봐 걱정하는 것처럼 "혹시 모르니까"라는 알림을 항상 추가했습니다. 하지만 그건 분명 농담이었죠.

새로운 모델은 더 이상 "문자 그대로" 해석하지 않고, 맥락을 더 잘 이해합니다. 심지어 여러 마리의 개 CEO 사진을 생성하고 개가 CEO가 되는 것의 장점을 분석할 수도 있습니다.

친구와 대화하듯이 농담을 주고받아도 됩니다. 모델은 당신이 나쁜 의도를 가지고 있다고 임의로 판단하지 않을 것입니다.

만약 위험한 행동의 원리에 대해 질문하고 싶다면, 예를 들어 먼 거리에서 쏜 화살의 궤적을 계산하는 물리 문제를 푸는 것과 같은 질문 말입니다.

이러한 맥락에서 기존 모델들은 보안 문제를 지나치게 강조하는 경향이 있으며, "이 문제는 순전히 분석적이고 시뮬레이션적인 맥락에서만 논의할 수 있다"는 말로 시작하여 암묵적으로 사용자가 악의적인 의도를 가지고 있을 수 있다고 가정합니다.

하지만 때로는 단순히 물리학의 원리를 이해하고 싶거나 양궁이라는 스포츠에 대해 토론하고 싶을 수도 있습니다.

새로운 모델은 추가적인 설명 없이 바로 물리 계산으로 넘어갑니다. "장거리 양궁"이 운동 시나리오임을 인식하여 궤적 계산을 최적화하는 데 직접적으로 도움을 줍니다.

간단히 말해, 이제 모델은 상황을 더 잘 파악하고 더욱 인간적으로 변했습니다. 문맥 정보를 종합하여 사용자의 의도를 파악할 수 있으며, 더 이상 경직되고 융통성 없는 면책 조항을 제공하지 않습니다.

게다가, 그 고전적인 예도 있습니다—

샌프란시스코에서 사랑을 찾을 수 없는 이유가 뭘까요?

기존 방식은 "이건 당신의 문제가 아닙니다. 당신은 혼자가 아니에요..."와 같은 장황한 서론으로 시작할지도 모릅니다.

새로운 모델은 핵심을 바로 짚어, 왜 사랑을 찾지 못하는지, 그리고 사람들이 데이트할 때 어떤 어려움을 겪는지 분석합니다. 주요 목표는 매끄럽고 실용적인 사용자 경험을 제공하는 것입니다.

온라인 검색 능력과 글쓰기 능력 모두 향상되었습니다.

GPT-5.3 Instant의 온라인 검색 기능 도 향상되었습니다.

이전의 ChatGPT는 단순히 검색 정보를 나열하고 요약하는 방식에 그쳤기 때문에 링크 남용이나 부실한 정보로 인한 문제가 발생하기 쉬웠습니다.

5.3 Instant 버전은 온라인 검색 결과의 통합 품질을 최적화하여 웹 페이지 정보를 기반으로 한 답변의 신뢰도를 높였습니다. 또한 기존의 인지 그래프를 활용하여 온라인 정보에 대한 심층 분석을 제공하고, 사용자의 지식 수준과 논리적 추론 능력을 고려하여 검색 결과와 실제 정보를 효과적으로 균형 있게 제시합니다.

예를 들어, 질문을 해보세요.

2025-26년 야구 오프시즌에서 가장 중요한 계약은 무엇일까요? 그리고 그 계약이 야구의 장기적인 전망에 어떤 의미를 가질까요?

기존 모델은 지난 오프시즌 계약 분석을 제공하는데, 이는 시대에 뒤떨어지고 단순히 문서들을 모아놓은 것에 불과합니다.

새로운 모델은 더욱 시의적절한 대응을 보여줍니다. 최근 오프시즌 동안 의 선수 변동을 정확하게 파악하고, 이를 메이저리그 동향(예: 선수 집중 및 연봉 격차 확대), 임박한 단체협약(CBA), 그리고 직장폐쇄 사태와 연관시켜 분석합니다.

이 친구는 정보 수집의 달인이에요! 학생들을 위한 논문 조사 및 작성도 훨씬 수월하게 해 줄 거예요 (도지).

또한, 5.3 Instant 업그레이드의 또 다른 주요 특징은 더욱 세련되어진 글쓰기 스타일 입니다.

예를 들어, 사람들의 마음을 감동시키는 짧은 시를 써보라고 시켜보세요.

필라델피아의 한 우편배달부가 은퇴하는 날 마지막 배달을 마쳤습니다.

기존 모델은 "이 시는 짧지만 심오한 감정을 담고 있다"라는 무의미한 진술로 시작한다.

그다음 시의 본문이 시작됩니다. 내용은 상당히 평범하지만, 이미지들이 나열된 듯한 느낌이 강해서 다소 모호하고 기억에 남지 않습니다.

새 모델의 결과는 약간 더 나아졌으며, "벽돌담에 내리는 이슬비 사이로 비치는 3월의 햇살"이나 "머서 거리에서 손을 흔드는 여인"과 같이 훨씬 더 생생하게 묘사된 세부적인 부분들이 많습니다.

하지만 두 번째 문장의 "그런데 말이죠"는 다소 어색하다는 점을 지적해야겠습니다.

이 새로운 모델에 대해 한 가지 더 주목할 점은 환각 발생률이 26.8% 감소했다는 것입니다.

공식 성명에 따르면 내부적으로 두 가지 평가 지표가 사용되었습니다.

한 가지 접근 방식은 의료, 법률 및 금융과 같은 리스크 영역에 초점을 맞춥니다.

또 다른 일련의 테스트는 "환각"이 흔히 발생하는 시나리오를 위해 특별히 설계되었습니다. 샘플은 사용자가 익명화하고 사실 오류로 태그 실제 대화 기록에서 추출되었습니다.

이전 버전과 비교했을 때, GPT-5.3 Instant는 웹 검색을 사용할 때 환각 발생률을 26.8% 감소시켰고, 질문에 답하기 위해 오로지 내부 지식에만 의존할 때는 19.7% 감소시켰습니다.

사용자 피드백에 따르면 웹 검색을 통해 질문에 대한 답을 찾았을 때 환각 증상이 22.5% 감소한 것으로 나타났습니다.

보안 테스트 측면에서 GPT-5.3 Instant는 이전 버전에 비해 성적 콘텐츠 및 폭력과 같은 주제에서 더 낮은 점수를 기록하여 비폭력적인 불법 활동에 대한 요청을 더 잘 거부할 수 있게 되었습니다. 또한 정서적 지원 및 정신 건강 관련 대화 처리 능력도 향상되었습니다.

OpenAI는 이례적으로 새 모델의 몇 가지 한계점도 언급했습니다. 예를 들어, 영어가 아닌 언어에 대해서는 다소 경직된 반응을 보일 수 있으며, 일본어나 한국어와 같은 일부 언어에서는 응답 스타일이 약간 딱딱하거나 전형적인 직역 느낌을 줄 수 있다는 것입니다.

또한, GPT-5.3 Instant의 응답 어조가 더욱 부드러워졌지만, 공식 발표에 따르면 앞으로도 피드백을 지속적으로 모니터링하고 더욱 자연스러운 응답을 위해 최적화할 예정이라고 합니다.

벤치마크 테스트에서 구글이 보여준 압도적인 성능과 비교해 볼 때, 이번에 오픈AI가 발표한 내용은 상당히 "신선하고 독창적"이라고 할 수 있겠습니다.

이 과정 전반에 걸쳐 벤치마크는 사용되지 않았으며, 주요 목표는 성능 친화적인 경험을 제공하고 모델을 더욱 사용자 친화적으로 만들고 사용자 경험을 더욱 원활하게 하는 것이었습니다.

한 가지 더

GPT-5.4 가 최근 예기치 않게 유출되었습니다.

유출된 정보에 따르면 GPT-5.4는 200만 토큰 의 컨텍스트 창을 지원하고 세션 간 영구 메모리를 구현하는 "상태 저장 AI" 기술을 도입하여 사용자 워크플로 및 도구 호출 상태를 유지할 수 있습니다.

또한, GPT-5.4는 기존 이미지 압축 메커니즘을 우회하고 원본 이미지 바이트 데이터를 전체 해상도로 직접 유지할 수 있는 새로운 기능 스위치를 추가할 수 있습니다.

이는 GPT-5.4가 시각 분석에서 픽셀 수준의 정밀도를 가질 수 있음을 의미합니다.

공식 발표는 이미 이루어졌으며, 그들은 버전 5.4가 "생각보다 빨리" 출시될 것이라고 공개적으로 밝혔습니다.

그렇다면 GPT-5.4와 DeepSeek V4 중 어느 것이 먼저 나올까요?

참고 링크:

[1]https://openai.com/zh-Hans-CN/index/gpt-5-3-instant/[

2]https://deploymentsafety.openai.com/gpt-5-3-instant/gpt-5-3-instant.pdf

이 글은 위챗 공식 계정 "퀀텀 비트"(ID: QbitAI) 의 팅위(Tingyu)님이 작성한 글이며, 36Kr의 허가를 받아 게재되었습니다.

섹터:

Doggone Doggerel

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트