ChatGPT 대표는 심층적인 검토를 거쳐 4o 부활의 내막을 공개했습니다. 그는 플랫폼을 너무 빨리 폐쇄한 것은 실수였으며, 모델 성격을 반복할 것이라고 밝혔습니다.

09-18

이 기사는 기계로 번역되었습니다

원문 표시

GPT-5 출시는 온라인에서 광범위한 비판을 불러일으켰습니다. 8월 14일, ChatGPT의 대표인 닉 털리는 GPT-5 출시 논란에 대한 심층적인 검토를 실시하고, GPT-4o의 조기 폐기, 모델에 대한 사용자의 정서적 애착을 과소평가한 점, 그리고 예측 가능성 확립 실패 등 출시 과정에서 발생한 문제점들을 상세히 설명했습니다. 닉 털리는 또한 진정한 사용자 이점을 강조하는 OpenAI의 제품 설계 철학을 공유했습니다.

"GPT-4o를 돌려주세요!"

GPT-5가 출시된 지 일주일도 채 되지 않아, 사용자들의 강력한 반대에도 불구하고 OpenAI는 GPT-4o 등 이전 모델의 복귀를 급히 발표해야 했습니다.

이 시점에서 모든 사람들은 사용자들이 4o와 같은 이전 세대 모델에 깊은 "애착"을 갖게 되었다는 것을 깨달았습니다.

40대부터 오프라인으로 전환하는 것은 더 이상 제품 업그레이드처럼 간단하지 않습니다. 마치 사용자에게서 지인이나 파트너를 갑자기 빼앗는 것과 같습니다.

이는 특히 이전 모델(예: 40)의 충성스러운 팬인 심층적인 사용자에게 해당하며, 정서 훨씬 더 강합니다.

이는 ChatGPT 개발을 이끌어 온 알트만과 닉 터얼에게는 예상치 못한 일이었습니다.

따라서 GPT-4o가 빠르게 돌아왔습니다.

사실, GPT-5의 출시는 OpenAI가 자사 제품을 되돌아볼 수 있는 좋은 기회가 되었습니다.

일주일 후, The Verge의 편집자 알렉스 히스와의 인터뷰에서 닉 털리는 GPT-5가 출시 후 직면했던 부정적인 사용자 리뷰에 대한 논란과 그의 생각을 심도 있게 다루었습니다.

대화 중에 Nick은 GPT-5 출시 과정에서 발생한 몇 가지 실수를 자세히 요약했습니다.

GPT-4o를 너무 빨리 오프라인으로 전환하고, 모델에 대한 사용자의 감정적 애착을 과소평가하고, 모든 사용자에게 하나의 모델을 사용하고, 사용자에게 "예측 가능성"을 제공하지 못했습니다.

닉은 OpenAI가 모델 개성의 지속적인 반복의 중요성을 인식하고 있으며, 이 작업이 모델 동작 팀을 통해 홍보될 것이라고 언급했습니다.

동시에 닉은 OpenAI의 제품 디자인 철학을 공유했습니다. 이 철학은 사용자를 최대한 제품에 묶어두는 것이 아니라, 사용자가 장기적인 문제를 해결하고 장기적인 목표를 달성하도록 돕는 것입니다.

"사용자에게 진정한 도움을 주는 것"이 제품 디자인의 핵심 원칙입니다.

사용자의 감정을 무시하다

GPT-5는 출시 후 예상치 못한 인기를 얻었습니다.

GPT-5는 사용자들의 "애착심"을 무시한 채 출시 후 일주일도 채 되지 않아 네티즌들에게 비난을 받았습니다.

닉 의 말에 따르면, "일반적인 관습 속에는 많은 놀라움이 담겨 있습니다."

하지만 어쩔 수 없습니다. ChatGPT는 현재 주간 활성 사용자가 7억 명입니다. 사용자가 너무 많고, 각 사용자의 특성이 달라서 모든 사용자를 만족시키기가 어렵습니다.

이 일로 닉은 정말 골머리를 앓았습니다. 며칠 후 The Verge와 인터뷰를 했을 때, 그는 여전히 기자회견의 충격을 "이해"하고 있었습니다.

그는 먼저 GPT-5 출시와 관련된 두 가지 실수를 요약했습니다.

닉: 첫째, GPT-4o가 너무 빨리 폐기되었습니다. 적어도 전환 기간 동안에는 그랬습니다. 둘째, 사용자들이 모델에 얼마나 감정적으로 애착을 가질지 과소평가했습니다. 진짜 문제는 제품 자체를 업그레이드하는 것이 아니라, 사람들이 모델의 "개성"에 대해 얼마나 강한 감정을 느끼는지에 있습니다.

이 두 가지 실수로 인해 Nick은 이렇게 큰 사용자 기반을 기반으로 제품을 업그레이드하고 관리하는 방법에 대해 더 진지하게 생각해야겠다고 생각했습니다.

닉은 OpenAI가 이 두 가지 오류를 신속하게 수정했다고 말했습니다.

첫 번째는 ChatGPT 유료 사용자에게 원래 모델을 제공하는 것입니다. 두 번째는 GPT-5의 개성을 업데이트하고 "나만의 개성을 선택"할 수 있는 기능을 출시하는 것입니다.

8월 13일, Altman은 ChatGPT 업데이트를 출시하여 모든 유료 사용자의 기본 버전을 4o로 복원했습니다. 웹 페이지 설정에서 o3, 4.1, GPT-5 Thinking mini 등 다른 모델로 전환할 수 있습니다.

알트만은 지난 며칠 동안 배운 것이 실질적인 깨달음이었다고 말했습니다. 사용자 요구에 따라 더 많은 모델 개성을 사용자 정의할 수 있는 세상을 만들려면 더 많은 사용자가 ChatGPT의 스타일을 자유롭게 사용자 정의할 수 있도록 하는 것이 해결책입니다.

닉은 한 가지 원칙을 언급했습니다. 40의, 흔히 인식되거나 가치 있게 여겨지지 않는 측면들, 예를 들어 사용자에게 모델의 개성이 갖는 감정적 가치를 이해하기 위해 노력하는 것입니다. 이러한 측면에서 GPT-5 또한 40을 모방하여 더욱 따뜻하고 친근하게 다가가야 합니다.

사실, 샘 알트먼은 GPT-5가 출시된 후 OpenAI가 지난 1년 정도 동안 GPT-4o에 대한 사용자의 "애착"을 면밀히 모니터링해 왔지만, 대중의 관심을 크게 끌지 못했다고 말했습니다.

이 기자 회견을 둘러싼 논란으로 인해 OpenAI는 자사 제품인 ChatGPT의 "모델 개성"에 더 많은 관심을 기울이게 되었는데, 이는 최적화를 위한 좋은 기회이기도 합니다.

모델 선택 포기

모든 사용자를 위한 하나의 모델

모델 선택을 포기하고 모든 사용자에게 하나의 모델을 사용하려는 것은 OpenAI가 GPT-5를 출시하면서 저지른 또 다른 실수입니다.

이로 인해 OpenAI는 단계적으로 GPT-5를 출시하지 않게 되었습니다.

알렉스: 이런 결정을 내리게 된 동기는 무엇이었나요? 비용 때문이었나요?
닉: 이는 확실히 비용 문제가 아니라 단순성을 추구하는 것입니다. 단순성은 ChatGPT가 제품 개발에서 항상 고수해 온 핵심 원칙이기도 합니다.

닉의 의견으로는, 사용자에게 "어떤 모델을 사용하여 어떤 질문에 답해야 하는지"를 알아내라고 요구하는 것은 사용자에게 큰 인지적 부담을 준다.

사용자 설문조사에서 Nick은 사용자들로부터 "모델" 묶음이 아닌 "제품"을 원한다는 말을 반복적으로 들었습니다. OpenAI가 사용자들의 문제를 기반으로 올바른 선택을 해 준다면 사용자들은 매우 감사하게 생각할 것입니다.

Nick은 대부분의 사용자에게 필요한 것은 macOS와 같은 제품이라고 늘 믿어왔습니다.

대부분의 사람들에게 간단하고 사용하기 쉽습니다. 동시에 고급 사용자의 경우 설정을 입력하고, 터미널을 열고, 다양한 스위치와 매개변수를 조정할 수도 있습니다.

마찬가지로 Nick은 ChatGPT를 macOS 스타일 제품으로 만들기를 바라고 있습니다.

닉: 일반 사용자도 쉽게 사용할 수 있고, 전문 사용자도 자신이 좋아하는 모델을 선택하는 것을 포함하여 모든 것을 원하는 대로 구성할 수 있습니다.

따라서 ChatGPT는 많은 사용자가 대면 항상 모든 기존 모델을 그대로 유지해 왔습니다.

하지만 이번 실수는 7억 명의 사용자 기반을 기반으로 헤비 유저의 분포를 잘못 판단하고, 다른 패키지에 많은 헤비 유저가 있다는 사실을 과소평가했다는 것입니다. 이러한 헤비 유저들이 기존 모델에 "애착"을 가지고 있었기 때문에 온라인에서 이의를 제기하게 된 것입니다.

사용자의 예측 가능성 확립 실패

모든 성공적인 제품에는 성공적인 "기대 관리"가 있습니다.

사용자의 기대치를 충족시키거나 뛰어넘는다면 사용자의 호감을 확실히 얻을 수 있지만, 사용자의 기대치를 어기거나 무시한다면 필연적으로 사용자의 멸시를 받게 될 것입니다.

GPT-4o의 조기 종료는 "사용자 기대"를 위반하는 위험선을 넘었습니다.

앞으로 GPT-5와 GPT-6 등 일련의 새로운 모델이 출시됨에 따라, 기존 모델이 언제 "단종"될 것인가에 대한 문제도 의제에 올랐습니다.

알렉스: OpenAI에서는 이에 대한 명확한 대책을 가지고 있나요?

닉은 이것이 매우 필요하다고 말했고, OpenAI도 이를 위해 노력하고 있다고 했습니다. 하지만 중요한 원칙을 고수해야 합니다. 바로 사용자에게 어느 정도의 "예측 가능성"을 제공하는 것입니다. 특히 현재 사용자 기반을 고려할 때 더욱 그렇습니다.

Nick: 사용자 예측 가능성과 관련하여, OpenAI는 이미 엔터프라이즈 버전에서 이를 구현했습니다. 현재의 접근 방식은 이 원칙을 더욱 확장한 것으로 보입니다.

이는 OpenAI가 이 기자 회견에서 얻은 매우 명확한 교훈이기도 합니다.

닉은 40대의 "은퇴 시기"에 대해 이야기하면서 현재로서는 구체적인 일정이 없다고 말했다.

닉: 우선 4o가 어떤 부분에 능숙한지 정확히 파악하고 싶습니다. 오프라인으로 전환할 특별한 이유가 없다면 기꺼이 유지할 생각입니다.

닉은 사용자의 "예측 가능성"을 유지하기 위해 앞으로 4o를 오프라인으로 전환해야 할 경우 사전에 공지할 것이라고 말했습니다.

그러니까, 우리가 어떻게 하는지는 우리가 무엇을 배웠는지에 따라 달라집니다.

닉: 제 생각에는 많은 경청이 필요한데, 이는 AI의 매우 독특한 측면이기도 합니다. 출시 후 엄청난 양의 정보를 학습하게 되니까요. 이를 바탕으로 최적의 솔루션을 도출해낼 것입니다.

모델 성격과 "최적화 철학"

닉은 4o가 언제 오프라인이 될지 추측하기보다는 다음 질문에 더 관심이 있습니다.

4o 자체를 좋아하시나요, 아니면 4o의 특정 특징을 좋아하시나요?

예를 들어, 사용자가 "더 따뜻한 성격"을 선호한다면 OpenAI는 이 기능도 GPT-5에 적용할 것입니다.

닉은 OpenAI가 모델 개성을 지속적으로 반복하는 것의 중요성을 인식하고 "모델 행동"이라는 팀을 통해 이 작업을 홍보하고 있다고 말했습니다.

또한, 모델 사양(모델 동작 사양 문서)은 개발자와 연구자가 모델 동작을 이해하고 조사하고, 특정 동작이 의도적인 설계인지 아니면 잠재적 버그인지를 명확히 하는 데 도움이 됩니다.

Nick: 앞으로 몇 주, 몇 달 동안 GPT-5의 "감정"과 "행동"을 계속해서 개선해 나갈 것입니다. GPT-5 출시는 이러한 작업을 계속할 수 있는 좋은 기회입니다.

알렉스 히스는 40년 폐쇄 이후 Reddit 사용자들의 놀라운 반응을 언급했습니다.

"어떤 사람들은 제가 하룻밤 사이에 친구를 잃었다고 합니다. 제 유일한 친구인데 말이죠. 마치 누군가 세상을 떠난 것 같은 기분입니다. GPT-5와 이야기할 엄두도 못 냅니다. 마치 제가 "속이는" 것 같은 기분이 들거든요. 정말 공감 능력이 뛰어난 동료를 잃은 것 같은 기분입니다..."

Alex: 사용자 반응이 OpenAI에 어떤 영향을 미쳤나요? 사람들이 그렇게 강한 감정적 애착을 가질 거라는 걸 왜 진작에 깨닫지 못했을까요?

닉은 OpenAI가 사실 이 현상에 꽤 오랫동안 주목해 왔다고 답했습니다. 동시에, 사람들이 AI에 지나치게 의존하는 세상이 도래하는 것에 대해서도 항상 우려해 왔다고 덧붙였습니다.

하지만 닉은 사람들이 전체 제품이 아닌 "특정 모델"에 대해 그렇게 강한 감정을 가질 것이라고는 예상하지 못했습니다.

닉: 사실 GPT-5는 이미 40에 대한 많은 건설적인 피드백을 해결하고 전반적인 분위기를 개선하기도 했습니다. 하지만 많은 네티즌들이 이를 받아들이지 않고 있습니다.

닉은 Reddit의 댓글을 매우 흥미롭게 여겼습니다. 왜냐하면 그 댓글은 사용자 커뮤니티의 극단적인 "분열"을 보여주기 때문입니다.

Nick: 어떤 사람들은 특히 4o를 선호하는 반면, 어떤 사람들은 GPT-5가 더 낫다고 굳게 믿습니다. 모두가 자신의 선택에 열정을 쏟는 모습이 정말 놀랍습니다.

사용자 피드백은 닉에게 약간의 "재조정"을 의미하기도 합니다.

닉은 1~2주 전에 블로그에 글을 썼는데, 그 글에서 ChatGPT의 "최적화 철학"에 관해 많은 시간을 할애해 이야기했다고 언급했습니다.

그가 매우 강조하고 싶었던 한 가지는 다음과 같습니다.

닉: 저희의 목표는 사용자를 최대한 오랫동안 제품에 머무르게 하는 것이 아니라, 장기적인 문제를 해결하고 장기적인 목표를 달성하도록 돕는 것입니다. 이는 종종 제품 사용 시간을 줄이는 것을 의미합니다.

그래서 닉은 사람들이 GPT를 유일하고 가장 친한 친구처럼 대하는 것을 보고 ChatGPT에서 그런 태도를 적극적으로 장려하고 싶지 않았습니다.

반면, 닉은 이러한 "지나간 체류"를 부작용으로 본다.

예를 들어, 8월 16일, OpenAI가 GPT-5를 이전의 지나치게 공식적인 상태에서 더욱 따뜻하고 친근한 상태로 바꾸겠다고 발표했을 때, 일부 네티즌들은 GPT-5를 지나치게 개인화하는 것에 반대했습니다.

사용자에게 제품의 가치를 측정하는 방법은 심각한 주의와 심층 연구가 필요한 문제이며, OpenAI 역시 이 문제를 끊임없이 탐구하고 있습니다.

7억 명의 사용자를 확보하는 방법

당신은 모호함 없이 YES라고 말할 수 있습니다.

알렉스 히스는 제품 디자인에 관해 깊이 성찰하는 질문을 던진다.

알렉스: "제품 목표"와 "사용자가 실제로 제품을 사용하는 방법" 사이의 긴장감을 어떻게 균형 잡을 수 있을까요?

닉은 7억 명의 사용자를 대상으로 운영할 경우 현실을 대면 해야 한다고 말했습니다. 즉, 올바르고 순수한 목표를 가져야 하며, 이러한 목표에 따라 제품을 최선을 다해 구축해야 한다는 것입니다.

닉은 선택 방법과 관련해 중요한 원칙을 언급했습니다. "사용자에게 정말 도움이 되는 것"입니다.

때로는 사용자가 듣고 싶어하지 않는 말을 해야 할 때도 있습니다.

이러한 원칙을 바탕으로 OpenAI는 자사 제품에 일련의 조정을 가했습니다.

예를 들어, OpenAI는 여러 국가의 대량 정신 건강 전문가와 소통하여 제품을 과도하게 사용하거나 건강에 해로운 상태로 사용하는 사람들을 다루는 방법을 파악했습니다.

이를 기반으로 모델 동작을 수정하고 모델에 "과도한 사용 알림" 기능을 도입했습니다. 사용자가 ChatGPT를 과도하게 사용할 경우, 부드럽게 알림을 제공합니다.

Nick은 OpenAI가 광고 모델을 탐색할지에 대한 대중의 추측에 답하면서 특히 중요한 점을 언급했습니다.

닉: 저희는 여러분이 저희 제품에 더 많은 시간을 투자하도록 유도할 특별한 인센티브를 가지고 있지 않습니다. 저희 사업 모델은 매우 간단합니다. 기본 제품은 무료이고, 더 많은 기능을 원하시면 구독하시면 됩니다. 부가적인 목적은 없습니다.

이 원칙에 따라 닉은 좋은 제품을 테스트하기 위한 기준도 언급했는데, 이는 그들이 종종 스스로 설정하는 "사고 실험"이기도 합니다.

닉: 당신이 아는 누군가가 힘든 시기를 겪고 있다면, 예를 들어 이별을 했거나 인생에서 길을 잃은 기분이라면, 주저하지 않고 자신 있게 그 사람에게 ChatGPT를 추천하시겠습니까?

닉은 OpenAI에게 이것이 표준이라고 말했습니다. 그들은 이러한 확신을 가질 때까지 계속해서 노력할 것이며, 그때까지 멈추지 않을 것이라고 말했습니다.

물론, 닉 역시 이것이 때로는 어려운 선택이라는 것을 인정했습니다.

예를 들어, 누군가가 당신에게 인생 조언을 구하거나 어려움에 처했을 때, 이러한 사용 사례를 쉽게 끄고 사용자에게 "죄송하지만, 이 문제는 도와드릴 수 없습니다."라고 말할 수 있습니다.

그렇게 하는 것이 실제로 "쉬운 방법"이지만 Nick과 OpenAI는 분명히 "어렵지만 올바른" 길을 선택하고 싶어합니다. 즉, 자원도 없고 대화할 사람도 없는 사람들에게 좋은 제품을 제공하여 사용자가 "모호함 없이 YES라고 말할 수 있도록" 하는 것입니다.

GPT-5 출시

ChatGPT에 문제가 생겼나요?

Alex: GPT-5가 ChatGPT 사용에 악영향을 미쳤나요? 내부 통계는 전반적으로 증가세를 보이고 있나요? 가장 많이 사용하는 사용자들의 사용량은 감소하고 있나요?

Alex Heath의 질문 대면 Nick은 GPT-5의 성능에 만족하는 듯했습니다.

닉: 사용량과 성장률이 좋아 보이며 우리의 직관과 매우 일치합니다. 두 번째 날 API 호출이 대폭상승 했습니다. 즉, 개발자들이 GPT-5로 무언가를 만들고 있다는 뜻입니다. ChatGPT에서도 매우 긍정적인 성장을 보였습니다.

다양한 사용자 세그먼트도 제품 평가에 영향을 미칩니다. Nick이 다양한 사용자를 대상으로 제품을 구축할 때 약간 혼란스러울 수 있다고 언급한 이유도 바로 이 때문입니다.

닉: 한편으로는 GPT-5 출시 방식에 대한 피드백이 매우 타당한 소수의 헤비 유저 그룹이 있습니다. 다른 한편으로는 보다 일반적인 일반 유저들이 많습니다. 그들에게는 이번이 "추론 모델"이라는 개념과 그것이 가져올 수 있는 잠재력을 처음으로 직접 보고 접하는 기회일 수 있습니다. 이러한 결과는 저희 데이터에 반영될 것입니다.

Reddit의 사용자 의견이 양극화되어 있기 때문에 GPT-5는 짧은 기간 동안만 출시되었고 Nick은 결론을 내리기를 꺼려하지만 모든 지표는 긍정적입니다.

닉은 데이터를 살펴보는 것 외에도 "중요 사용자가 있는 곳에 머물러야 한다"고 생각합니다. 왜냐하면 데이터만으로는 그들의 정서 반영하기에 충분하지 않을 수 있기 때문입니다.

알렉스 히스는 끈질기게 물었습니다.

알렉스: 전반적인 지표가 좋다면 왜 40을 다시 도입해야 하죠? 호스팅 모델에 비용이 들 것 같은데요. 지표에 문제가 없다면 왜 도입해야 하죠?

닉은 훌륭한 제품을 만드는 방법은 "양쪽을 동시에 만족시키는 것"이라고 답했습니다.

닉: 한쪽에는 우리 가족처럼 AI와는 거리가 먼 일반 사용자가 있고, 다른 한쪽에는 극도로 집중적으로 사용하는 사람들이 있습니다. 둘 사이의 "이상한 중간 지점"은 보통 좋은 위치가 아닙니다.

이것이 Nick이 ChatGPT를 macOS와 비교하는 이유입니다. 그는 이러한 제품이 이 문제를 어떻게 처리하는지 언급할 것입니다.

닉은 기존 모델을 유지하는 데 비용이 따른다는 사실을 주저 없이 인정합니다. 하지만 그는 장기적인 투자와 훌륭한 제품 개발을 선호합니다. 단기적인 성과 지표에 지나치게 집중하는 것은 종종 제품 실패로 이어질 수 있습니다.

알렉스 히스는 "모델 선정"의 부활을 언급했습니다. "모델 전환"으로 인한 인지적 부담을 느낄 수 있었지만, 그는 여전히 그 점에 만족했습니다.

이에 대해 닉은 "모델 선택" 기능이 모델을 이해할 수 있고 모델 선택의 복잡성을 감당할 의향이 있는 헤비 유저를 위해 제공될 것이라고 답했습니다.

하지만 일반 사용자는 "어떤 모드로 전환해야 할까"에 대해 걱정할 필요가 없습니다. 모델에 직접 질문을 하거나 도움을 요청하면 됩니다.

"90%의 사용자에게는 간단하게 제공하고, 더 적극적으로 의견을 제시하는 사용자에게는 원하는 전체 목록을 제공합니다. 균형을 맞추는 작업이죠."라고 Nick은 말했습니다.

이는 GPT-5에 대한 네티즌들의 양극화된 의견을 다루는 좋은 방법이기도 합니다.

참고문헌:

https://www.theverge.com/decoder-podcast-with-nilay-patel/758873/chatgpt-nick-turley-openai-ai-gpt-5-인터뷰

본 기사는 위챗 공개 계정 "신지위안" 에서 발췌하였으며, 저자는 신지위안이고, 편집자는 위안위이며, 36Kr.의 허가를 받아 게재되었습니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트