AI 마스터 카르파티가 직접 ChatGPT 모델 사용 가이드를 전수합니다. o3는 복잡한 작업 처리에 적합하고, 4o는 일상적인 질문에 능숙하며, GPT-4.1은 코드 작성에 사용됩니다. 에릭 헤이즈는 ChatGPT의 핵심 메모리 시스템을 공개하여 ChatGPT가 사용자를 더욱 잘 이해하도록 도와줍니다.
여러분은 아마도 ChatGPT를 사용해보았고 매우 즐거웠을 것입니다. 하지만 여러분은 그것을 잘못 사용하고 있을 가능성이 높습니다!
걱정하지 마세요. OpenAI의 창립자인 안드레이 카르파티가 이렇게 말했습니다. 그는 AI 대중화에 "열정적"이며 또 다른 움직임을 보였습니다.
이번에 Andrej Karpathy가 그림을 통해 ChatGPT 모델을 선택하는 방법을 알려드립니다!
우리 모두 알다시피, OpenAI는 이 모델에 GPT-4o, o3, o4-mini, o4-mini-high, o1 pro mode 등 많은 이름을 붙였습니다.
너무 눈부셔서 사람들은 이 모델들의 차이를 알아차리지 못할 정도입니다.
적절한 모델을 선택할 수 없다는 이유에서라도, 매일 사용하기에는 한 달에 20달러의 Plus "가격"이 아깝고, 200달러의 Pro 멤버십 비용은 더더욱 그렇습니다.
많은 사람들은 이러한 ChatGPT 모델이 서로 매우 다르다는 사실을 모릅니다. 예를 들어:
o3는 중요하거나 어려운 문제를 다루는 데 가장 좋은 선택입니다.
4o보다 훨씬 강력한 추론 능력을 가진 모델입니다. ChatGPT를 전문적으로 사용하고 o3를 사용하지 않는다면 손해를 볼 가능성이 높습니다.
4o와 o4는 완전히 다른 것입니다.
위대한 카르파티조차도 OpenAI의 이름이 정말 혼란스럽다고 농담을 했습니다.
4o는 간단하거나 중간 정도의 난이도를 가진 문제를 매일 풀기에 적합한 선택입니다. 하지만 o4는 현재 미니 버전만 출시되어 o3만큼 좋지 않습니다.
이 모델을 사용하지 마세요!
카르파티는 또한 o4-mini, o4-mini-high, o1-pro와 같은 모델은 아무런 이점이 없으므로 사용해서는 안 된다고 강조했습니다!
카르파티는 OpenAI가 왜 지금 o4-mini를 출시했는지 이해할 수 없다고 말했습니다.
AI 전문가가 ChatGPT 플레이 방법을 알려드립니다
Karpathy는 자신의 경험과 ChatGPT의 다양한 모델 간의 차이점을 바탕으로 다음과 같은 "사용자 가이드"를 제공합니다.
간단한 질문
예를 들어, "식이섬유가 풍부한 음식은 무엇입니까?" => 4o를 사용하세요(카르파티가 사용하는 양의 약 40%)
어렵거나 중요한 문제라면 조금만 더 기다려 주시면 됩니다.
"이 세금 문제를 이해하도록 도와주세요..."와 같이 => o3 사용(Karpathy의 사용량의 약 40%)
코드를 무심코 작성하거나 생각대로 코드를 변경할 때
예를 들어, "이 코드를 다음으로 변경하세요..." => GPT-4.1 사용(약 10%)
어떤 주제를 심도 있게 이해하고 싶으신가요?
GPT가 10분만 투자해서 많은 링크를 확인하고 완전한 정보 세트를 요약해 주기를 바랍니다.
예를 들어, "Luminar의 부흥과 몰락을 이해하도록 도와주세요" => 심층 조사(약 10%)
참고: 심층 연구는 모델 선택기의 버전이 아니며 도구 도구에서 켜지는 기능입니다.
최하위 수준에서는 o3를 기반으로 하지만, 카르파티는 이것이 o3를 직접 사용하는 것과 정확히 같지는 않다고 생각합니다(카르파티는 확신하지 못하지만).
카르파티가 제시한 모델을 올바르게 사용하는 방법을 터득하면 ChatGPT가 점점 더 좋아지고 있음을 알게 될 것입니다.
그리고 여러분이 ChatGPT를 더 많이 사용할수록, ChatGPT가 여러분을 점점 더 잘 이해한다는 것을 알게 될 것입니다. 마치 ChatGPT가 여러분의 "Jarvis"가 되어 여러분의 일상 생활에 대한 모든 것을 기억하는 것처럼요.
그 이유는 실제로 ChatGPT가 엄청난 메모리를 가지고 있기 때문인데, "혼란스러운" 이름에도 불구하고 여전히 많은 사람들이 ChatGPT를 사용하고 있으며, 의심할 여지 없이 주간 활동이 가장 많은 AI 도구입니다.
ChatGPT의 "슈퍼 메모리" 공개
ChatGPT는 당신을 점점 더 잘 알게 되며, 당신의 과거 선호도를 기억하고 여러 대화의 맥락을 연결하기도 합니다.
이는 단순한 맥락 창 이상의 의미를 갖습니다. 복잡하고 정교한 메모리 시스템이 작동하고 있습니다.
최근, 스타트업 회사의 엔지니어인 에릭 헤이스는 블로그 게시물을 통해 ChatGPT의 복잡한 메모리 시스템을 공개했습니다.
오늘은 에릭 헤이즈를 따라가서 ChatGPT를 돋보이게 하는 "기억의 마법"을 심층적으로 분석해 보세요!
ChatGPT의 메모리 시스템은 다른 대규모 언어 모델(LLM)보다 성능이 훨씬 뛰어납니다.
이는 주로 메모리 시스템을 "저장된 메모리"와 "채팅 기록"의 두 가지 범주로 구분했기 때문입니다.
저장된 메모리
ChatGPT에 환경 설정을 저장한다고 상상해 보세요. 이것이 바로 "메모리 저장" 기능입니다.
"내가 소프트웨어 엔지니어라는 걸 기억해" 또는 "내가 요리법을 추천할 때, 내가 채식주의자라는 걸 기억해"와 같이 명확한 지시를 통해 이러한 기억을 업데이트할 수 있는 간단하고 사용자가 제어할 수 있는 시스템입니다.
이러한 기억은 이후 대화에 영향을 미치는 사실로 시스템 프롬프트에 삽입됩니다. 예를 들어, ChatGPT에 간결한 답변을 선호하거나 Rust 프로그래밍 전문가라는 사실을 기억하도록 설정하면, 이러한 선호도에 따라 답변을 조정합니다.
ChatGPT는 이러한 추억을 확인하고 삭제할 수 있는 간편한 사용자 인터페이스를 제공합니다. 또한 명령을 통해 ChatGPT에 저장된 추억을 삭제하도록 요청할 수도 있습니다.
이 기능 또한 지능적입니다. 최소한의 중복 및 불일치 검사를 수행합니다.
예를 들어, "저는 소프트웨어 엔지니어입니다"라고 말하면 저장될 수 있지만, "저는 소프트웨어 엔지니어가 아닙니다"라고 말하면 거부하고 설명을 요구합니다.
그러나 관련성이 높지만 다른 정보(예: "소프트웨어 엔지니어", "프런트엔드 엔지니어")의 경우 공존이 허용됩니다.
이 시스템은 "바이오 툴"이라는 도구를 통해 구현됩니다. 에릭 헤이즈는 ChatGPT의 메모리 시스템을 역으로 해석하여 "바이오"라는 방법을 발견했습니다.
채팅 기록
"채팅 기록" 시스템은 "메모리 저장"보다 훨씬 복잡하며, ChatGPT의 응답성을 개선하는 데 핵심적인 역할을 할 수 있습니다. 이 시스템은 세 가지 하위 시스템으로 나뉩니다.
1. 현재 세션 기록
이는 봇의 단기 "단기 기억"과 같습니다. 현재 세션에서 사용자의 가장 최근 메시지를 기록합니다.
이 로그는 작으며, 보통 10개 미만으로 마지막 날의 메시지만 포함합니다.
현재 세션에서 사용자가 보낸 메시지를 직접 참조할 수 있습니다.
2. 대화 기록
이 시스템은 ChatGPT와의 과거 대화에서 관련 맥락을 기억하는 역할을 합니다.
또한, ChatGPT는 교차 대화 메모리를 수행할 수 있으며, 다른 대화에서 보낸 직접 메시지를 참조할 수 있습니다.
에릭 헤이즈는 테스트 과정에서 ChatGPT가 2주 안에 메시지를 정확하게 인용할 수 있다는 것을 발견했습니다.
2주 후에는 직접적인 인용문이 아닌 메시지 요약만 제공될 것입니다.
메시지 검색은 "대화 요약"과 "메시지 내용"으로 색인됩니다.
즉, 정확한 단어를 기억하지 못하더라도 ChatGPT는 대화 내용이나 주제를 설명하면 관련 정보를 찾을 수 있습니다.
오래된 대화의 경우, 시스템은 추론된 정보를 저장하여 구체적이지 않은 짧은 맥락을 제공할 수 있습니다.
3. 사용자 통찰력
이것은 ChatGPT에 가장 강력하고 "스마트한" 형태의 메모리일 수 있습니다!
이는 "기억 보존"의 더 진보적이고 불투명한 버전입니다.
이러한 인사이트는 여러 대화에서 사용자 행동과 질문을 분석하여 시스템에서 자동으로 생성됩니다. 여기에는 시간 범위와 신뢰 수준이 포함됩니다.
사용자 통찰력을 통해 전문 분야, 관심 분야 선호도, 질문 스타일 등 심층적인 정보를 포착할 수 있습니다.
예를 들어, "Rust 프로그래밍에 대한 광범위한 경험과 지식을 가지고 있다" 또는 "간결한 답변을 선호한다"고 기록할 수 있습니다.
ChatGPT는 이러한 세부적인 통찰력을 바탕으로 짜증나는 상호작용을 최소화하고 사용자가 쉽게 이해할 수 있는 방식으로 정보를 제공할 수 있습니다.
에릭 헤이스는 사용자 인사이트 시스템이 ChatGPT의 인지된 지능 향상의 80% 이상을 담당했을 것이라고 믿습니다!
에릭 헤이스는 이러한 통찰력이 실시간으로 생성되지 않고 일괄 처리(예: 일주일에 한 번 실행되는 크론 작업)를 통해 업데이트될 수도 있다는 사실을 발견했습니다.
사용자 쿼리를 클러스터링 최적화 문제로 모델링하여 대량 의 과거 메시지에서 고유하고 유용한 통찰력을 클레임.
이는 사용자 경험에 어떤 의미를 갖나요?
ChatGPT를 "사용하기 쉬운" 것처럼 느끼게 하는 것은 바로 이러한 복잡한 메모리 시스템입니다!
메모리를 절약하면 기본 설정을 직접 지정하고 ChatGPT가 사용자에게 맞는 응답을 제공하도록 할 수 있습니다.
사용자 인사이트를 통해 이 과정이 자동화됩니다. 명시적으로 알려주지 않더라도 ChatGPT는 사용자의 이전 행동을 기반으로 자동으로 응답을 조정하고, 더욱 적절한 설명을 제공하며, 반복적인 질문을 방지할 수 있습니다.
채팅 기록 시스템은 대화의 연속성을 보장하여 이전 주제를 검토할 수 있는 동시에 ChatGPT가 이전 상호작용에 대한 공유 지식을 유지하여 반복적, 순환적 또는 모순되는 상호작용을 방지합니다.
ChatGPT의 메모리 시스템은 단순한 컨텍스트 창을 넘어 계층적이고 지능적인 방식으로 정보를 저장하고 검색하여 사용자 경험을 크게 향상시키고, 학습하고 성장할 수 있는 지능형 파트너와 같은 느낌을 준다고 할 수 있습니다.
참고문헌
https://x.com/karpathy/status/1929597620969951434
https://macro.com/app/md/54115a42-3409-4f5b-9120-f144d3ecd23a
본 기사는 위챗 공개 계정 "신지위안" 에서 발췌하였으며, 저자는 Dinghui이고, 36Kr.의 출판 허가를 받았습니다.



