글로벌 대규모 모델 진화의 다음 방향: OpenAI의 GPT-5가 출시되었습니다.

avatar
36氪
08-08
이 기사는 기계로 번역되었습니다
원문 표시

(OpenAI CEO 샘 올트먼이 GPT-5를 출시하고 있다. 이미지 출처/OpenAI 공식 생중계)

미국의 스타 AI(인공지능) 스타트업 OpenAI의 매 세대 기함 모델은 전 세계 미래 기술 트렌드를 6개월 앞서 이끌어왔다. 미국 서부 시간 8월 7일, 이 회사는 GPT-5를 출시했다.

OpenAI CEO 샘 올트먼은 GPT-3가 고등학생과 대화하는 느낌이었다고 표현했다. 가끔 영감이 번뜩이긴 했지만 짜증나는 부분도 많았다. GPT-4o는 대학생과 대화하는 것 같으며, 진정한 지능과 실용성을 갖추고 있다. 이제 GPT-5와는 전문가와 대화하는 것 같다 - 어떤 분야에서든 언제든 대기하고 있는 전문 박사급 전문가와 대화하는 것 같으며, 그들은 당신의 모든 목표를 달성하는 데 도움을 줄 수 있다. GPT-5는 단순히 대화만 할 수 있는 것이 아니라 당신을 위해 일을 할 수 있다.

GPT-5는 두 개의 모델(심층 사고 버전 + 고효율 버전, 전자는 깊이 있는 사고가 가능하고 후자는 효율적인 문답이 가능하다)로 구성된 시스템이다. 사용자가 질문할 때 자동으로 버전을 전환한다.

OpenAI 공식 웹사이트에 공개된 성능 벤치마크 테스트 결과에 따르면, GPT-5는 이전 세대 기함 모델 OpenAI o3를 능가했으며, GPT-5(심층 사고 버전)의 환각 수는 o3보다 6배 적었다. 국제 시장 조사 기관 Artificial Analysis의 장기 글로벌 주요 모델 성능 벤치마크 테스트 결과, 8월 8일 기준으로 GPT-5는 현재 전 세계에서 성능이 가장 뛰어난 모델이다.

(이하 생략)

둘째, 비디오 생성 모델이 성숙하고 사용 가능해질 것이며, 올해 말에 폭발적인 성장을 맞이할 것으로 예상됩니다. 이는 에이전트가 세계를 이해할 뿐만 아니라 더욱 동적이고 직관적인 방식으로 콘텐츠를 생성하고 프로세스를 시뮬레이션할 수 있음을 의미합니다.

셋째, 다단계 복잡한 작업 처리 능력이 크게 향상될 것이며, 올해 말에 중요한 breakthrough가 있을 것으로 예상됩니다. 이는 에이전트가 성숙해지는 핵심 단계입니다. 모델이 수십 단계 또는 수백 단계의 복잡한 작업을 안정적이고 신뢰할 수 있게 계획하고 실행할 수 있을 때, 에이전트의 "미완성" 문제가 근본적으로 해결될 것입니다.

우 디의 관점에 따르면, 현재 대부분의 멀티 에이전트 애플리케이션은 "장난감 같다"고 하지만, 이 세 가지 기술 트렌드의 breakthrough를 바탕으로 그는 최종적으로 2025년 말 멀티 에이전트 애플리케이션의 정확도가 크게 향상될 것이라고 판단했습니다. 2025년 말 시각적 이해와 추론 능력을 갖춘 AI 애플리케이션이 보급된 후에는 기본 작업에 소비되는 해시레이트가 10만 토큰을 초과할 수 있습니다. 그때쯤 토큰 소비량이 빠르게 증가할 것입니다.

새로운 모델 경쟁의 막이 오르다

모델, 애플리케이션, 해시레이트의 "선순환"의 기반은 지속적으로 향상되는 모델 능력입니다. 2025년, 글로벌 기술 기업들의 대규모 모델 경쟁이 더욱 치열해지고 있으며, 대규모 모델의 반복 속도가 가속화되고 있습니다.

대규모 모델 분야의 지식 반복은 "월" 또는 심지어 "주" 단위로 이루어집니다. 한 논문이나 한 모델이 기존의 기술 경로를 뒤집을 수 있습니다. 한 경험 많은 알고리즘 엔지니어는 《재경》에 대해 대규모 모델 분야에서 매주 많은 학술 논문이 발표되고 있으며; 거의 매월 새로운 기술적 breakthrough가 있고; 거의 3~4개월마다 선두 모델이 추월당한다고 말했습니다.

《재경》의 불완전한 통계에 따르면, 2025년 1월 1일부터 8월 8일까지의 220일 동안 모델 경쟁에 참여한 중국과 미국의 11개 기술 기업(알리바바, 바이트댄스, 텐센트, 바이두, 화웨이, DeepSeek, 월지암면, 구글, OpenAI, Anthropic, xAI 포함)은 최소 32개 버전의 대규모 모델을 출시하거나 반복했으며, 평균적으로 6.9일마다 새로운 대규모 모델이 출시되었습니다.

기본 모델의 업데이트 주기는 점점 더 짧아지고 있습니다. OpenAI의 GPT-4.5에서 GPT-5까지의 업데이트 주기는 161일; OpenAI의 o1에서 o3까지는 132일; xAI의 Grok 3에서 Grok 4까지는 142일; DeepSeek-R1의 두 버전은 128일; DeepSeek-V3의 두 버전은 87일; 구글 제미니(Gemini) 2.5의 두 버전은 단 42일입니다.

GPT-5의 출시는 중국과 미국의 기술 기업들이 새로운 대규모 모델 경쟁을 벌이도록 압박할 것입니다. 더 강력한 모델 훈련, 더 큰 규모의 해시레이트 확보 등의 경로는 단기간에 변경되지 않을 것입니다.

현재 대규모 모델의 발전에는 몇 가지 핵심 기반이 있습니다. 첫째는 데이터, 둘째는 알고리즘, 셋째는 해시레이트로, 이는 "기적은 대규모 투자로 만들어진다"는 원칙에 의존하며, 거대한 리소스 투입으로 성능 향상을 얻습니다.

올해 6월, 듀크 대학교 전자 및 컴퓨터 공학과 교수 진이런은 《재경》에 AI 진화의 기본 경로는 여전히 "기적은 대규모 투자로 만들어진다"라고 말했습니다. 모두가 이 모델의 미래와 잠재력이 언제 소진될 것인지에 대해 논의하고 있으며, 학계에서도 새로운 경로를 찾으려 노력하고 있습니다. 하지만 현재 다른 효과적인 방법은 없으므로 산업계에도 선택의 여지가 많지 않아, 계속해서 "기적은 대규모 투자로 만들어진다" 방식을 따라가고 있습니다.

현재, 중국 기술 기업들은 알리의 Qwen 3가 올해 7월 업데이트된 버전으로 일시적으로 OpenAI가 올해 4월에 출시한 o3와 동등한 수준에 도달했습니다. GPT-5의 출시는 새로운 추격전의 시작을 의미합니다.

《재경》에 따르면, 알리의 대규모 모델 연구개발 부서인 통의 실험실의 올해 핵심 목표 중 하나는 모델 성능, 다운로드 수, 파생 모델 수 모두에서 선두를 유지하는 것입니다.

알리 클라우드 CTO이자 통의 실험실 책임자인 주징런은 올해 6월 마고다 개발자 컨퍼런스 그룹 인터뷰에서 《재경》에 모델 성능은 충분한 경쟁력을 갖추어야 하며, 권위 있고 인정받는 벤치마크 테스트에서 자신의 실력을 증명할 수 있어야 한다고 말했습니다.

그는 또한 통의 실험실이 글로벌 최첨단 기술 동향을 추적하고 평가하는 것을 일상 업무의 일부로 여기고 있다고 언급했습니다. 그들은 인공지능 최고 컨퍼런스(AAAI, IJCAI, ICML, NIPS 등 최고 수준의 국제 학술 회의)의 논문뿐만 아니라 글로벌 오픈소스 커뮤니티, 기술 블로그, 그리고 선두 AI 기업의 제품 출시를 면밀히 추적합니다.

위의 경험 많은 알고리즘 엔지니어는 대규모 모델 분야에서 어떤 성능 우위도 일시적일 뿐이며, 경쟁은 지속적으로 계속된다고 생각합니다.

본 기사는 위챗 공식 계정 "반숙 재경"(ID: Banshu-Caijing)에서 가져왔으며, 작성자는 우준위, 주원이고 36크의 허가를 받아 게시되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트