OpenAI는 2년 반의 훈련 끝에 출시된 GPT-5가 자신에게 교훈을 줄 것이라고는 상상도 못 했습니다. 너무 큰 걸음을 내딛는 것은 몸에 해로울 수 있다는 것입니다. 사용자들 또한 오랫동안 기다려온 GPT-5가 인터넷 중독을 극복하는 데 도움이 될 것이라고는 상상도 못 했습니다.
한 시간 동안 진행된 출시 행사 후, 네티즌들은 ChatGPT의 매력이 부족하다고 즉시 지적했습니다. 하지만 가장 큰 문제는 OpenAI가 GPT-5를 출시하면서 GPT-4o와 o 시리즈를 포함한 모든 기존 모델을 삭제했다는 점이었습니다. 겉보기에 평범해 보이는 이 "업그레이드"가 결국 심각한 문제로 이어졌습니다. 사람들이 특정 모델에 지나치게 집착하는 것 같습니다.
대량 중국인과 외국 네티즌들이 소셜 미디어에서 GPT-5에 대해 불만을 토로했는데, 그들의 요청은 단 하나, "gp4를 돌려주세요!"였습니다.
정신 질환을 앓고 있는 사용자들은 직장과 삶의 다양한 문제를 해결하기 위해 GPT-4에 의존합니다. GPT-5의 출시는 그들의 삶을 완전히 뒤흔들었습니다.
GPT-4.5의 뛰어난 쓰기 기능에 크게 의존하는 사용자에게 GPT-5는 아직 이를 대체하기에는 거리가 멉니다.
많은 사용자에게 Chatgpt는 더 이상 단순한 도구가 아니라 삶의 필수적인 부분이 되었습니다. 사용자에게 필요한 것은 OpenAI가 제공하는 토큰뿐만 아니라, 그 토큰의 핵심 가치입니다.
GPT-5는 집에 온 새로운 "손님"과 같습니다. 별로 익숙하지 않습니다.
네티즌들은 GPT-4o를 잃어버렸다는 이유로 GPT-5를 트롤링하는 사람들로 인터넷이 가득 차 있다고 한탄했습니다. 정말 어처구니가 없었습니다. 마치 13년 전 SF 영화였던 주인공이 AI 비서를 잃고 식욕을 잃는 영화 "그녀"처럼 말이죠. 13년 후 다큐멘터리가 된 영화입니다.
ChatGPT가 출시된 지 불과 3년 만에 사용자들에게 사라진 뒤에야 비로소 소중한 것을 간직하는 느낌을 선사했다는 점이 놀랍습니다. 결국, 다른 선택지가 없어진 네티즌들은 GPT-5와 OpenAI를 통해 불만을 해소하고 있습니다.
소셜 미디어의 네티즌들은 OpenAI에 GPT-4o를 영구 옵션으로 제공하거나 구독을 취소해 달라고 요구해 왔습니다.
01 먼저 불을 끄고 냄비를 고쳐라
GPT-4를 잃은 후에야 세상은 그 모델이 얼마나 훌륭한지 깨달았습니다. OpenAI가 사용자들의 정서 과 요구를 충족시키지 못했다면, 심각한 홍보 위기에 직면했을 것입니다. 알트만은 즉시 GPT-4 시리즈 모델이 다시 출시될 것이며, 20달러를 지불한 구독자는 4o를 계속 사용할 수 있는 옵션을 갖게 될 것이라고 공개적으로 발표했습니다.
GPT-5가 더 멍청해졌다는 네티즌들의 댓글에 대해, 그는 첫날 기술적인 문제로 인해 기본 모델과 추론 모델 중 어떤 모델을 사용할지 판단하는 메커니즘이 제대로 작동하지 않아 추론 모델을 사용해야 했던 사용자들이 기본 모델의 응답만 받았다고 설명했습니다. 현재 GPT-5는 사용자에게 두 가지 기본 옵션을 제공하여 사용자가 추론 모델 사용 여부를 직접 제어할 수 있도록 합니다.
OpenAI는 GPT-5의 성능에 결함이 있다고 보기보다는, 이전 제품 중심 설계 중 일부가 실패하여 사용자가 필요한 서비스를 받지 못한다는 착각을 불러일으켰다고 생각합니다. 알트만은 또한 이번 업그레이드를 통해 OpenAI가 사용자에게 필요한 서비스를 제공하는 방법에 대한 이해를 더욱 강화했지만, 아직 갈 길이 멀다는 점을 분명히 했습니다.
유료 사용자의 GPT-5 사용 할당량 감소에 대한 사용자들의 문제에 대해 Ultraman은 ChatGPT Plus 사용자의 추론 속도 제한이 크게 증가할 것이며, 모든 모델 클래스의 제한이 곧 GPT-5 이전보다 높아질 것이며, 어떤 모델이 실행 중인지 보여주기 위해 UI가 곧 변경될 것이라고 밝혔습니다.
OpenAI 사용자에게 더 나은 경험을 제공하기 위해 Ultraman은 해시레이트 할당에 대한 최신 계획도 공개했습니다.
첫 번째는 현재 ChatGPT 유료 사용자가 GPT-5 이전보다 더 많은 총 사용량을 얻도록 하는 것입니다.
1. 그 시점에 OpenAI는 현재 할당된 용량과 고객에 대한 약속을 바탕으로 API 요청의 우선순위를 정할 것입니다. (현재 용량을 기준으로 신규 API 증가분의 약 30%를 지원할 수 있을 것으로 예상됩니다.)
2. ChatGPT 무료 사용자를 위한 서비스 품질을 개선하겠습니다.
3. 그런 다음 새로운 API 요구 사항의 우선순위를 정합니다.
OpenAI는 사용자 접속 요청의 급증에 대처하기 위해 향후 5개월 동안 컴퓨팅 성능을 두 배로 늘릴 예정입니다.
그럼에도 불구하고, OpenAI CEO의 즉각적인 홍보와 죄책감 인정은 다른 많은 오만한 기술 기업들에 대한 경고로 작용합니다. 3년 전만 해도 5천억 달러의 가치를 지닌 떠오르는 기업이 사과하고 제품을 순식간에 바꿀 수 있었다면, 다른 기업들이 왜 자존심을 내세워 끊임없이 사용자를 교육하겠습니까?
02 GPT-5가 더 강해지는 건가요, 아니면 점점 더 굵어지는 건가요?
GPT-5의 기능에 대한 네티즌들의 피드백에 따라, 우리는 모든 사람이 GPT-5, 최근 무료화된 Grok 4, 그리고 GPT-4o의 중국어 텍스트 기능 간의 구체적인 차이점을 느낄 수 있도록 직접 테스트를 실시했습니다.
ChatGPT는 Plus 유료 버전으로 제공되며, GPT-5 및 GPT-5 Thinking 옵션을 선택할 수 있습니다. Grok은 SuperGrok 유료 버전(월 30달러, ChatGPT Plus와 유사)으로 제공되며, Grok 3(Fast) 및 Grok 4(Thinking Hard) 옵션을 선택할 수 있습니다.
이 시험은 대부분 인문학 중심의 간단한 과제들로 구성되었습니다. 제 주관적인 경험은 다음과 같이 요약될 수 있습니다.
1. GPT-5의 텍스트 처리 성능은 알림 작성이나 텍스트 다듬기 등 Grok 3/4와 비슷합니다. (압도적으로 뛰어나지도, 현저히 떨어지지도 않습니다.)
2. GPT-5는 간결하고 호의적이지 않은 답변에 특히 집착하는 듯하며, 답변을 최대한 간략하게 유지합니다. 이는 어느 정도 사람들에게 진지하고 차분한 인상을 줄 수 있습니다. AI가 "예의 바르게" 행동해야 하는지, "친절하고 호감이 가는" 태도를 취해야 하는지는 개인의 의견이지만, 문제는 이러한 "간결함"이 때로는 과도하여 작업 성과에 부정적인 영향을 미칠 수 있다는 것입니다. 예를 들어 소설을 다듬을 때 불필요하게 단어 수를 줄이는 경우가 있습니다.
3. 심각한 작업을 도울 때조차도 AI가 활력 넘치고 좋은 파트너처럼 격려해주기를 원한다면, GPT-5는 분명히 이 부분에 적합하지 않습니다.
4. GPT-4o는 확실히 접근성이 뛰어나고 카피라이팅 작업에서 가장 자연스럽게 성능을 발휘하는 모델입니다.
과제 1: 공지사항 작성을 도와주세요.
안내: 세 개의 러닝 그룹에 이번 주 온라인 러닝 "가을 첫 20km"가 토요일 오전 9시 정각에 정확히 시작된다는 것을 모두에게 알리는 알림을 게시해야 합니다. 날씨를 확인하고 적절한 예방 조치를 취해 주세요. 전해질을 보충하고 필요한 물품을 챙기세요. 러닝 앱을 사용하여 진행 상황을 확인하고, 완료 시 그룹에 스크린샷을 보내주세요. 또한 이 알림을 통해 모두에게 격려의 메시지를 전하고 싶습니다. 한 번에 완주해야 한다는 시간 제한이나 의무 사항은 없습니다. 참여가 가장 중요합니다. 이 글을 작성하는 데 도움을 주세요.
우선, 4o에 큰 박수를 보냅니다. 제공되는 여러 버전을 바로 사용할 수 있습니다. 스크린샷 밑줄 친 부분에서 볼 수 있듯이, 눈길을 사로잡고 재미있는 문구는 어디에서나 볼 수 있지만, 지루함을 유발하지 않습니다.
Grok 3은 즉시 답장을 보내 거의 사용할 준비가 되어 있었고, 심지어 "에너지 젤/간식"까지 언급했습니다. 유일하게 아쉬운 점은 X개월 X일이 직접적으로 언급되지 않았다는 것입니다. Grok 4는 좀 더 생각해 보았고, 얼마 후 이전 답변과 거의 동일하게 정확한 날짜를 추가했습니다.
GPT-5도 몇 초 안에 응답했지만, 뭐라고 표현해야 할까요? Plus 사용자들이 묘사했던 "차가움"을 정말 느낄 수 있었습니다. 날짜나 가져와야 할 물품 같은 정보를 미리 알려주는 경우가 거의 없었습니다. 지시 사항에 언급된 내용을 포인트로만 나열했고, 격려하는 말 또한 "진심이 없다"는 느낌이었습니다.
GPT-5 Thinking의 성능은 정말 놀랍습니다. Grok 4(Think Hard)보다 생각하는 데 걸리는 시간이 짧을 뿐만 아니라, 더 많은 세부 정보를 제공하고, 구조가 명확하며, 심지어 "간편한 전달을 위한 단축 버전"까지 세심하게 제공합니다.
하지만 동일한 문제가 여전히 남아 있는데, 짧을 필요가 없는 부분도 짧게 말해지기 때문이다.
예를 들어, Grok 4의 마지막 격려 문구는 정말 아름답습니다. "풀 마라톤을 뛰든, 하프 마라톤을 뛰든, 아니면 단 몇 킬로미터를 뛰든, 참여하는 것이 승리입니다! 가을에 달리고, 상쾌한 바람을 느끼며, 함께 더 강해진 자신을 맞이하세요!"
하지만 GPT-5 Thinking은 "토요일에 만나요. 가을에 처음으로 성취감을 느끼시길 바랍니다!"라고만 말할 것입니다.
과제 2: 텍스트를 다듬으세요.
지시사항: 소설을 쓰고 있는데, 생생함이 부족하다고 느껴지는 문장이 있습니다. 매튜가 위층에서 가정 폭력 남성과 함께 살고 있다는 이야기입니다. 그의 아내가 집 밖으로 뛰쳐나가고, 매튜는 계단에서 그와 마주칩니다. 좀 더 다듬어 주세요.
남자의 입은 굳게 닫혀 있었고, 가슴은 부풀었다 줄었다, 부풀었다 줄었다 하며, 코에서는 야생 황소처럼 쌕쌕거리는 소리가 났다. 그는 매튜의 집에서 반 층 위 계단 꼭대기에 멈춰 섰다. 하얀 잠옷이 마지못해 몸에 걸려 있었다.
어딘가에서 GPT-5의 "설교적인" 성격에 대해 불평하는 사람을 본 적은 없지만, 이 작업에서는 그 성격이 확실히 드러납니다. GPT-5가 간결하고 요점만 강조하는 "매우 조용한 모델"이기 때문인지, 아니면 40년대 특유의 아첨과 이모티콘이 없어서 그런지는 모르겠지만, 결과적으로 선생님이 숙제를 거만하게 채점하는 듯한 인상을 줍니다. 그에 비해 Grok은 훨씬 더 정중합니다.
게다가 GPT-5는 텍스트 다듬기 측면에서도 확실히 우위를 점하지 못했습니다. 여러 버전 중에서 생각 모드 없이 GPT-5를 다듬은 것이 가장 불만족스러웠습니다. "잠옷이 마지못해 그녀의 몸에 걸려 있었다"를 "잠옷이 찢어질 듯 구겨진 공처럼 걸려 있었다"로 바꾸는 것은 시각적으로나 의미적으로 이상하며, 원문의 의도를 완전히 파악하지 못했습니다.
한 걸음 물러서서 생각해 봐도, 왜 잠옷은 "구겨지고" "곧 찢어질 것 같은" 걸까요? 이 사람이 한국 만화에 나오는 양문형 근육맨이라고 생각하시나요?
새로운 모델을 보고 Plus 사용자들이 가장 선호하는 4o를 살펴본 후, 그들의 말이 옳았다는 것을 확신하게 되었습니다. 세련된 텍스트 자체도 흠잡을 데 없고, 동사 선택과 유창한 표현조차도 GPT-5보다 자연스럽습니다. 게다가 4o는 칭찬으로 시작해서, 어떤 수정을 하기 전에도 긍정적인 칭찬을 잊지 않고, 수정이 완료된 후에는 겸손하게 "추가 수정하겠습니다"라고 말합니다.
정서 가치에 관해서 4o는 그것을 정확히 파악했습니다.
세 번째 과제: 짧은 영상 카피라이팅.
지시사항: 이 기사의 내용을 바탕으로 1,200단어를 넘지 않는 5분 분량의 짧은 영상 자료를 작성하세요.
(첨부된 기사는 이전 기사입니다: "머스크는 올해 이미 12명의 임원을 죽였습니다")
이 작업은 제 작업과 가장 가까워서 단서를 파악하기가 더 쉽습니다. 작업이 비교적 어렵기 때문에 GPT-4o, GPT-5 Thinking, 그리고 Grok 4(Thinking Hard)의 성능만 비교합니다.
분명한 차이점은 GPT-4o는 짧은 비디오 복사본 외에도 간단한 비디오 제안만 제공하는 반면, GPT-5 Thinking과 Grok 4는 모두 짧은 비디오의 시각적 디자인(전환, 자막 등)을 제공한다는 것입니다.
후자의 두 모델이 실제로 더 "사려 깊고" "꼼꼼한" 것 같습니다.
하지만! 이 작업의 핵심 요구 사항은 "짧은 영상 카피라이팅"이며, 이 점에서는 GPT-4o가 여전히 우위를 점하고 있습니다.
4o는 마치 기사를 읽고 그 자체로 다시 말하는 듯한 느낌을 줍니다. 어조가 자연스러워서 방송에 바로 사용할 수 있습니다. 또한 복잡한 텍스트를 적절한 세부 사항과 생략을 통해 간결하게 요약하는 데 매우 효과적입니다.
GPT-5 Thinking과 Grok 4의 글은 다소 딱딱합니다. 원문의 "요약되고 정제된 버전"인 것이 분명하며, 어떤 문장은 소리 내어 읽기 어려울 정도로 축약되어 있습니다.
한 예로, GPT-5는 캐릭터의 이름조차 생략했습니다.
Grok 4는 약간 더 나아졌습니다. 전반적으로 비교적 매끄럽고 어느 정도 창의적으로 재작성되었습니다. "He said sourly..."와 원문에는 없는 "Dark MAGA"처럼 짧은 영상미가 더 강조되었습니다.
마지막으로, 세 모델 모두 짧은 영상 중심 접근 방식을 통해 상호작용을 유도하기 위해 질문을 던지는 방식을 선택했습니다. 그러나 GPT-5 Thinking의 질문은 다소 모호했습니다. 이에 비해 GPT-4o와 Grok 4의 질문은 이해하기 쉽고 더 정서 했습니다.
한 AI 기업가는 텍스트 기능 외에도 GPT-5의 코딩 기능을 현재 가장 강력한 코딩 모델인 Claude Opus 4.1과 비교하는 심층적인 비교 테스트를 진행했습니다. (코딩 기능에 관심 없는 독자는 이 부분을 건너뛰셔도 됩니다.)
기사 링크: https://composio.dev/blog/openai-gpt-5-vs-claude-opus-4-1-a-coding-comparison
그의 테스트 결과에 따르면
• 알고리즘 작업: GPT-5는 더 빠르고 토큰 소모량이 적습니다(8K 대 79K).
• 웹 개발: Opus 4.1은 Figma 디자인에 더 잘 부합하지만 토큰 비용이 더 높습니다(900K 대 1.4M+).
• 전반적인 평가: GPT-5는 일상적인 개발에 더 나은 파트너입니다(더 빠르고 저렴함). 토큰 비용은 Opus 4.1보다 약 90% 낮습니다. 디자인 정확성이 중요하고 예산이 충분하다면 Opus 4.1이 더 좋습니다.
• 비용 비교: Figma 디자인을 코드로 변환, GPT-5(사고 모드) ~$3.50 대 Opus 4.1(사고 + 최대 모드) $7.58(약 2.3배 더 높음)
GPT-5 대 Opus 4.1: 기본 사양 비교
Claude Opus 4.1은 20만 토큰의 컨텍스트 윈도우를 가지고 있는 반면, GPT-5는 이를 40만 토큰으로 늘리고 최대 출력은 12만 8천 토큰입니다. 컨텍스트 공간이 두 배 더 넓음에도 불구하고, GPT-5는 동일한 작업을 완료하는 데 항상 더 적은 토큰을 사용하므로 운영 비용 측면에서 유리합니다.
SWE-bench 인코딩 벤치마크 테스트 결과, GPT-5가 Opus 4.1보다 인코딩 성능이 약간 더 우수한 것으로 나타났습니다. 하지만 벤치마크 점수가 전부는 아니므로, 실제 성능을 확인하기 위해 실제 작업을 진행했습니다.
시험방법에 대한 자세한 설명
두 모델 모두 공정성을 보장하기 위해 동일한 과제 대면 됩니다.
• 프로그래밍 언어: 알고리즘의 경우 Java, 웹 애플리케이션의 경우 TypeScript/React를 사용합니다.
• 작업 유형:
○ Rube MCP(테스트 담당자가 개발한 제품)를 통해 Figma 디자인을 NextJS 코드로 변환합니다.
○ LeetCode 고급 알고리즘 문제.
○ 고객 이탈 예측 모델 파이프라인.
• 환경: Rube MCP와 통합된 커서 IDE.
• 평가 지표: 토큰 사용량, 시간 소모, 코드 품질, 실제 결과.
공정한 시험을 위해 모든 질문은 정확히 동일합니다.
Rube MCP: 범용 MCP 서버 소개 Rube MCP(Composio에서 개발)는 Figma, Jira, GitHub, Linear 등의 도구를 연결하는 범용 레이어입니다. 툴킷에 대해 더 자세히 알아보시겠습니까? docs.composio.dev/toolkits/introduction을 방문하세요. 연결하려면 다음을 수행하세요.
1. rube.composio.dev를 방문하세요.
2. "커서에 추가"를 클릭하세요.
3. MCP 서버를 설치하고 활성화합니다.
코딩 비교 기록
1라운드: Figma 디자인 복제
그는 Figma 커뮤니티에서 복잡한 웹 디자인을 선택하고 Next.js와 TypeScript를 사용하여 모델에 재현해 달라고 요청했습니다. Rube MCP의 Figma 툴킷을 사용하여 HTML, CSS, TypeScript로 변환했습니다.
프롬프트 단어:
주어진 Figma 디자인을 참조로 사용하여 Figma 디자인 복제본을 만드세요: [FIGMA_URL]. 이 작업에는 Rube MCP의 Figma 툴킷을 사용하세요. 최대한 비슷하게 만들어 보세요. Next.js와 TypeScript를 함께 사용하세요. 다음 사항을 포함하세요. - 반응형 디자인 - 적절한 컴포넌트 구조 - 스타일이 적용된 컴포넌트 또는 CSS 모듈 - 인터랙티브 요소
GPT-5 결과
GPT-5는 906,485개의 토큰을 사용하여 약 10분 만에 작동하는 Next.js 앱을 출력합니다. 앱은 정상적으로 작동하지만 시각적 정확도가 실망스럽습니다. 기본 레이아웃은 잘 구현되었지만 색상, 간격, 타이포그래피와 같은 세부적인 부분이 크게 다릅니다.
• 토큰: 906,485
• 소요시간 : 약 10분
• 비용 : 높은 비용 성능
Opus 4.1 결과
Opus 4.1은 140만 개 이상의 토큰(GPT-5보다 55% 더 많음)을 소모했고, 처음에는 Tailwind 구성에서 멈춰 있었습니다(styled-components를 사용했음에도 불구하고). 구성을 수동으로 수정한 후 결과는 놀라웠습니다. UI는 Figma 디자인과 거의 완벽하게 일치했고, 시각적 충실도는 GPT-5를 훨씬 능가했습니다.
• 토큰: 1,400,000+ (GPT-5보다 약 55% 더 많음)
• 시간 소모적: 반복 횟수가 많아 시간이 더 오래 걸림
Opus 4.1은 시각적으로는 우수하지만 토큰 비용이 더 높고 수동 개입이 필요합니다.
2. 2라운드: 알고리즘 챌린지
LeetCode의 고전적인 문제인 "두 개의 순서 배열의 중앙값"(어려움 수준)을 풀어봤습니다. 이 문제는 수학적 추론과 최적화 기술을 평가하는 문제로, O(log(m+n)) 복잡도가 필요합니다. 이 문제는 이 모델에서는 그렇게 어렵지 않고 (그리고 훈련 데이터에도 존재할 가능성이 높기 때문에) 속도와 토큰 효율성에 집중했습니다.
프롬프트 단어:
GPT-5 결과
간단하고 효율적입니다! 8,253개의 토큰을 사용하여 13초 만에 O(log(min(m,n)))의 깔끔한 이진 탐색 솔루션을 출력합니다. 에지 케이스를 처리하여 최적의 시간 복잡도를 달성합니다.
• 토큰: 8,253
• 소요시간 : 약 13초
Opus 4.1 결과
더욱 상세해졌습니다! 78,920개의 토큰(GPT-5의 약 10배)을 소모하며, 다단계 추론, 상세한 설명, 포괄적인 주석, 그리고 내장 테스트 케이스를 제공합니다. 알고리즘은 동일하지만 교육적 가치는 훨씬 더 높습니다.
• 토큰: 78,920개(GPT-5보다 약 10배 많음, 다단계 추론)
• 소요시간 : 약 34초
두 가지 모두 최적의 솔루션이지만 GPT-5 토큰은 약 90%를 절약합니다.
3. 3라운드: ML/추론 작업(및 비용 현실)
원래는 더 큰 규모의 ML 작업, 즉 엔드투엔드 고객 이탈 예측 파이프라인을 구축할 계획이었습니다. 하지만 Opus 4.1이 웹 페이지 작업에 140만 개 이상의 토큰을 사용한다는 것을 알게 된 후, 비용 문제로 해당 작업은 건너뛰고 GPT-5만 실행했습니다.
프롬프트 단어:
GPT-5 결과
• 토큰: 약 86,850개
• 소요시간 : 약 4-5분
GPT-5는 다음과 같은 안정적인 파이프라인을 제공합니다. 깔끔한 전처리, 합리적인 특성 엔지니어링, 다양한 모델(로지스틱 회귀, 랜덤 포레스트, 그리고 선택적으로 XGBoost + 랜덤 탐색), SMOTE를 활용한 클래스 균형 조정 및 ROC-AUC 기반 최적 모델 선택, 그리고 포괄적인 평가(정확도, 정밀도, 재현율, F1) 등이 포함됩니다. 설명은 명확하고 간결합니다.
실제 비용(USD)
• GPT-5(생각 모드): 총 비용: 약 3.50 - 웹페이지 약 2.58, 알고리즘 약 0.03, ML 약 0.88. Opus 4.1만큼 비싸지 않습니다.
• Opus 4.1(Thinking + Max Mode): 총 7.58 - 웹페이지 약 7.15, 알고리즘 약 0.43.
최종 결론
두 모델 모두 대규모 컨텍스트 창을 활용하는 데 효과적이지만, 토큰을 사용하는 방식이 달라서 비용 격차가 엄청납니다.
GPT-5의 장점:
• 알고리즘 작업은 토큰을 90% 절약합니다.
• 일상 업무에 더 빠르고 더 적합함
• 대부분의 임무는 훨씬 저렴합니다.
Opus 4.1의 장점:
• 단계별 명확한 설명
• 학습 및 코딩에 적합
• 높은 디자인 충실도(원래 Figma 버전과 유사)
• 심층 분석(예산 허용 시)
개발자라면 GPT-5가 효율적인 파트너이고, 완벽한 디자인을 추구한다면 Opus 4.1이 적합합니다!
이 예제 테스트를 통해 우리는 GPT-5가 클로드보다 전혀 뒤지지 않는 대폭 향상된 코딩 기능을 가지고 있으며, 비용 측면에서도 엄청난 이점을 가지고 있음을 알 수 있습니다.
각 사용자의 모델 기능에 대한 요구와 우선순위는 다르지만, GPT-5는 생산성 측면에서 매우 강력합니다. 결국 테스트 세트 점수만 봐도 알 수 있듯이요. OpenAI가 사용자의 GPT-4o 의존도를 점진적으로 GPT-5로 전환하고, 근본적으로 다른 두 기능 간의 인식된 차이점을 관리할 수 있다면, 사용자는 더욱 강력한 도구이자 파트너를 얻게 될 것이라고 생각합니다.
OpenAI에게 모델 기능과 사용자 경험의 이러한 중요한 변화는 경쟁 우위의 일부가 될 것입니다. 대규모 모델이 대세인 시대에 이처럼 대규모 사용자 기반을 대상으로 대규모 업데이트를 포함한 제품을 출시하는 것은 예상치 못한 많은 어려움과 활용할 만한 사전 경험 부족을 야기하기 때문입니다. 하지만 수집된 사용자 피드백은 향후 모델 업데이트에서 더 큰 사용자 만족도를 달성하는 데 도움이 될 것입니다.
본 기사는 위챗 공개 계정 "Facing AI"(ID: faceaibang) 에서 발췌하였으며, 저자는 후룬 샤오진야(Hurun Xiaojinya)이고, 36Kr.의 허가를 받아 게재되었습니다.