Zhipu Qingyan은 ChatGPT에 패하고 상용화는 여전히 어렵고 장기적입니다.

avatar
36氪
05-18
이 기사는 기계로 번역되었습니다
원문 표시

글 장위 편집 양복성

"OpenAI 따라잡기"와 "Open AI 벤치마킹은 Zhipu AI 창립 이래 목표였습니다."는 Zhipu AI CEO Zhang Peng이 대중과 공유할 때 여러 번 언급한 말입니다. OpenAI를 많이 따라잡으세요.

OpenAI의 새로운 주력 언어 모델 GPT-4o가 봄 컨퍼런스에서 공개된 데 이어 Google은 I/O 개발자 컨퍼런스에서 Gemini를 기반으로 한 "AI 슈퍼 패밀리 버킷" 시리즈도 출시했습니다. Zhipu AI는 '중국의 OpenAI'가 될 가능성이 가장 높은 대형 모델 회사 중 하나로 여겨지지만, 국내외에서 '수백 모델 전쟁'이 격화되면서 Zhipu AI가 대면 상황은 별로 만족스럽지 않습니다.

Zhipu AI의 생성 AI 보조자 Zhipu Qingyan을 예로 들어 보겠습니다. 이는 ChatGLM2 인공 지능 언어 모델을 기반으로 개발된 대규모 모델 제품으로, 감독된 미세 조정과 결합된 수조 개의 텍스트 및 코드로 사전 훈련됩니다. 일반 Q&A, 다단계 대화, 창의적 글쓰기, 코드 생성, 가상 대화, AI 드로잉, 문서 및 그림 해석 등의 기능을 갖춘 기술입니다.

그러나 GPT-4 인공지능 언어 모델을 기반으로 OpenAI가 개발한 ChatGPT와 비교하면 Zhipu Qingyan은 여전히 ​​불리한 위치에 있습니다. 가장 직접적인 차이점 중 하나는 훈련 데이터 및 다양성, 언어 간 기능, 모델 크기 및 매개변수, 추론 기능 측면에서 ChatGLM2가 GPT-4보다 열등하다는 것입니다.

OpenAI와의 격차를 해소하기 위해 Zhipu AI는 2024년 1월 열린 제1회 Technology Open Day(Zhipu DevDay)에서 차세대 언어 모델 GLM-4를 출시했습니다. GLM-4의 전반적인 성능은 OpenAI에 비해 크게 향상되었습니다. 이전 세대의 60%는 "GPT-4와 동등"하다고 하지만 실제로는 GPT-4 수준의 약 90%에 불과합니다.

OpenAI가 새로 출시한 GPT-4o는 처리 속도를 200% 높였습니다. GPT-4o를 기반으로 OpenAI는 ChatGPT를 업데이트하고 업그레이드하여 더욱 강력한 음성 및 시각적 기능을 추가하여 ChatGPT를 더욱 현실감 있게 만듭니다. 향상된 - GPT-4o는 0.23초의 짧은 시간 안에 오디오 입력에 응답할 수 있으며, 오디오 응답 속도는 인간과 비슷한 수준에 도달했습니다.

분명히 GPT-4를 따라잡는 것은 이미 현재 Zhipu AI의 가장 시급한 과제입니다. GPT-4와 실제로 비교할 수 있는 언어 모델을 훈련할 수 있는지 여부는 상용화와 생태학적 발전에 특히 중요합니다.

01. OpenAI와는 아직 격차가 크다

Zhipu AI는 2019년 6월에 설립되었으며, 칭화대학 지식 공학 연구소(KEG)의 기술 성과를 바탕으로 현재 중국에서 유일하게 자체 개발한 대규모 모델 기업으로 GLM 사전 교육을 시작했습니다. 2020년 초에 아키텍처를 연구 개발하고 2022년에 100억 개의 매개변수 모델 GLM-10B를 훈련했으며 2023년에 1300억 수준의 초대형 사전 훈련 일반 모델인 GLM-130B를 공동 개발했습니다. AI는 1000억 개의 오픈소스 기반 대화 모델로 구성된 GLM 시리즈를 출시했으며, 2024년 1월 GLM-4를 출시했습니다.

Zhipu AI는 일찍 시장에 진입하고 OpenAI를 직접 벤치마킹했기 때문에 자본 기관의 사랑을 받는 존재가 되었습니다. 2023년 7월부터 9월까지 Zhipu AI는 총 5차례에 걸쳐 융자 받았으며 융자 금액은 25억 위안이 넘습니다. 주요 투자 기관에는 Zhongguancun Independent Innovation Fund, Meituan Strategic Investment Department, Ant Group, Alibaba, Tencent Investment가 있습니다. , Gao Ling Capital, Sequoia Capital 등 현재 가치 평가액이 200억 위안에 도달해 국내 AI 분야 '유니콘' 기업 중 하나가 됐다.

그러나 Zhipu AI와 OpenAI 사이에는 여전히 큰 격차가 있습니다.

기술적인 관점에서 OpenAI는 다양성, 이식성 및 확장성에 더 많은 관심을 기울입니다. GPT 시리즈 언어 모델은 다양한 시나리오에 적용할 수 있으며 고도로 맞춤화 가능합니다. 이와 대조적으로 Zhipu AI의 기술 경로는 다양한 시나리오와 작업의 요구 사항에 맞게 대형 모델의 사전 학습 및 미세 조정을 통해 "대형 모델 + 소형 모델"입니다. 이 기술 경로는 모델의 일반화 능력과 적용 범위를 향상시킬 수 있지만 모델의 복잡성이 높고 계산량이 많으며 학습 시간이 길다는 문제도 있습니다.

모델 규모 측면에서 OpenAI의 GPT 시리즈 언어 모델은 규모가 더 크고 대량 의 자연어 데이터를 처리할 수 있어 더 나은 모델 성능을 얻을 수 있는 반면, Zhipu AI의 모델 규모는 더 작고 데이터 처리 기능이 제한될 수 있습니다. 데이터 리소스 측면에서 모델 성능 및 일반화 능력에 영향을 미치는 반면, OpenAI는 모델을 훈련하고 최적화하는 데 사용할 수 있는 자연어 데이터 리소스가 대량 반면 Zhipu AI는 데이터 리소스가 상대적으로 적기 때문에 실패할 수 있습니다. 모델 훈련에는 효과와 성능이 제한됩니다.

둘 사이의 직접적인 차이는 사용자 수에 반영됩니다. 2022년 11월 OpenAI의 ChatGPT 사용자 수는 온라인에 접속한 지 단 5일 만에 100만 명을 넘어섰습니다. 2023년 1월에는 월간 활성 사용자 수가 1억 명을 돌파하여 역사상 가장 빠르게 성장하는 소비자 애플리케이션이 되었습니다. 반면 기관 추산에 따르면 2023년 11월 기준 Zhipu AI의 자회사인 Zhipu Qingyan의 일일 활성 사용자 수는 10만~40만 명에 불과합니다.

Zhipu Qingyan은 Baidu의 자회사인 Wenxinyiyan의 라이벌조차 아니라는 점은 언급할 가치가 있습니다. Wenxinyiyan은 2023년 11월 현재 약 80만명의 일일 활성 사용자를 보유하고 있으며, 2024년 4월 현재 Wenxinyiyan의 사용자 수는 2억 명을 넘어섰습니다. .

Zhang Peng은 또한 외국 대형 모델에 비해 국내 대형 모델의 개발이 나중에 시작되었다고 인정했습니다. 고성능 해시레이트 의 한계와 데이터 품질의 격차와 함께 국내 대형 모델은 측면에서 세계 고급 수준과 동등합니다. 규모와 핵심 역량에는 약 1년 정도의 격차가 있습니다.

02. Zhipu AI 상용화까지는 갈 길이 멀다

대형 모델을 어떻게 상용화하는지는 Zhipu AI를 포함한 모든 대형 모델 회사가 직면한 큰 과제입니다.

Zhipu AI는 상용화를 추진하는 중국 최초의 대형 모델 회사 중 하나이며, '서비스형 모델(MaaS)' 구현 경로를 최초로 제안한 기업입니다. 현재 Zhipu AI는 네 가지 비즈니스 모델을 탐색했습니다. 대형 모델을 개방형 플랫폼으로 캡슐화하고 개발자, 기업 등이 호출할 수 있는 API(응용 프로그래밍 인터페이스)를 제공하고 호출 횟수에 따라 비용을 지불하는 방식은 매우 간단하고 성숙하며 외국과 크게 다르지 않습니다. 둘째, 일부 국가를 대상으로 데이터 보안에 대한 중견기업의 요구에 맞춰 Zhipu AI는 클라우드 민영화 배포 솔루션을 제공하고 사용자가 클라우드 해시레이트 기반으로 특수 모델 영역을 열 수 있도록 지원합니다. 회사 자체 하드웨어 및 해시레이트 플랫폼에 배포합니다. 이는 기업의 관련 애플리케이션 개발 및 업무 개발 요구를 충족하기 위해 대형 모델의 기본 기능을 제공합니다. 네 번째는 소프트웨어와 하드웨어를 결합하고 대형 모델을 현지화하여 적용하고 바인딩하는 솔루션입니다. 고객 환경에서 개발의 필요성을 제거할 수 있는 Xinchuang 하드웨어. 배포 및 구현 프로세스는 소프트웨어와 하드웨어 통합을 통해 디버깅, 판매 및 배포됩니다.

Zhang Peng은 B 측의 지불 의향이 C 측, 특히 일반적으로 대형 모델에 더 많이 투자하고 빠르게 움직이는 업계 선두 기업보다 훨씬 낫다고 믿습니다. 그래서 Zhipu AI는 처음부터 B사이드를 목표로 삼았습니다. 2023년 현재 Zhipu AI는 2,000개 이상의 생태학적 파트너와 1,000개 이상의 대규모 모델 애플리케이션을 보유하고 있으며 200개 이상의 기업이 Zhipu AI와 미디어, 컨설팅, 소비, 금융, 다수의 선도 기업을 포괄하는 심층적인 공동 창작을 진행했습니다. 신에너지, 인터넷, 스마트오피스 등 다양한 분야에서 Zhang Peng은 2023년 하반기에 Zhipu AI에 수백 명의 고객이 주문을 체결할 것이며 2023년에는 전체 서명 금액이 1억 개가 넘을 것이라고 밝혔습니다.

하지만 지푸 AI가 상용화되기도 전에 대형 모델 업계에서는 '가격 전쟁'이 시작됐다.

5월 15일, Bytedance는 Doubao(Doubao universal model pro)의 주요 모델의 가격이 기업 시장에서 0.0008위안/천 토큰에 판매되는 반면, 시장에서 동일한 사양의 모델 가격은 일반적으로 0.12위안/천 토큰이라고 발표했습니다. .. 가격이 150 배인 Doubao 모델입니다. 5월 14일, OpenAI는 봄 컨퍼런스에서 GPT-4o의 API 가격을 50% 인하할 것이라고 발표했습니다.

이에 앞서 프랑스 AI 기업 미스트랄AI(Mistral AI)는 최신 대형 모델인 미스트랄 라지(Mistral Large)를 출시하고, ChatGPT를 벤치마킹한 최초의 챗봇인 르챗(Le Chat)을 출시했다. 가격 측면에서 Mistral Large의 입력 및 출력 가격은 Magic Square Quantification 산하 AI 회사인 DeepSeek에서 출시한 새로운 2세대 MoE 대형 모델 DeepSeek-V2의 API 가격인 GPT-4 Turbo보다 ​​약 20% 저렴합니다. , 백만 위안당 입력 1개, 출력 2위안(32K 컨텍스트), 가격은 GPT-4 Turbo의 거의 1%입니다.

"가격 전쟁" 대면 Zhipu AI는 또한 보급형 제품 GLM-3 Turbo 모델의 콜 가격이 5위안/백만 토큰에서 1위안/백만 토큰으로 인하될 것이라고 발표했습니다. 80%.

대형 모델의 지속적인 가격 하락은 상용화 속도를 높일 것으로 예상되지만, 동시에 '가격 전쟁'은 기업이 자체 수익성인 가격에 대해 양보해야 한다는 의미이기도 하다. 계속해서 '가격 전쟁'을 벌일 경우 이익은 더욱 줄어들 수 있고, 수익성 달성은 더욱 어려워질 수 있습니다.

Zhang Peng은 또한 2024년 Zhipu AI가 직면한 과제는 매우 어렵다고 인정했습니다. 한편으로 OpenAI의 슈퍼 인지 및 슈퍼 정렬 기술은 2024년에 새로운 돌파구를 달성할 것이며 이를 위해서는 Zhipu AI가 세계 최고의 기술을 지속적으로 반복해야 합니다. 한편, 2024년에는 대형 모델이 상용화의 물결을 몰고 올 것이며 Zhipu AI의 상용화 경쟁 압력도 높아질 것입니다.

Zhipu AI의 경우 현재 상용화 경로는 비교적 명확하지만, 대형 모델의 상용화 경로를 밟을 수 있는지 여부의 핵심은 비즈니스 모델 탐색뿐만 아니라 대형 모델 개발의 근본적인 문제를 해결하는 데 있습니다.

03.따뜻함을 위해 함께 모여라

오픈 소스는 Zhipu AI의 주요 특징이기도 합니다. Zhipu AI는 대규모 모델 오픈 소스 커뮤니티의 발전을 더욱 촉진하기 위해 번영하는 커뮤니티와 생태계를 만들기를 희망합니다.

Zhang Peng은 Zhipu AI가 OpenAI와 경쟁할 수 있는 몇 안 되는 국내 선도 기술 기업 중 하나라고 말한 적이 있습니다. 회사는 온체인 업스트림 및 다운스트림 파트너, 개발자 커뮤니티, 학계를 포함하여 AI 분야의 모든 참가자와 협력하여 중국의 새로운 AI 미래에 기여하기를 희망합니다.

2024년에 Zhipu AI는 오픈 소스 대형 모델 오픈 소스 펀드를 출시할 예정입니다. 이 계획에는 3개의 "1000s"가 포함됩니다. Zhipu AI는 대형 모델 오픈 소스 커뮤니티에 1,000개의 컴퓨팅 카드를 제공하여 오픈 소스 개발을 지원하고 천만 위안을 제공합니다. 대형 모델과 관련된 오픈 소스 프로젝트를 지원하는 데 사용되며 뛰어난 오픈 소스 개발자에게 1,000억 개의 무료 API 토큰을 제공합니다. Zhang Peng은 대형 모델 오픈 소스 펀드의 목적은 대형 모델 연구 및 개발의 큰 진전을 촉진하고 대형 모델의 전체 오픈 소스 생태계의 번영을 촉진하는 것이라고 말했습니다.

글로벌 대형 모델 기업가 대면 Zhipu AI는 'Z 계획'을 업그레이드하고 대형 모델 알고리즘, 기본 운영자 및 칩 최적화, 업계 대형 모델 및 슈퍼 애플리케이션.

또한 Zhipu AI는 많은 AI 산업 체인 회사에도 투자했습니다. 지금까지 Zhipu AI는 AI를 포함해 단일 투자 규모가 100만 위안에 달하는 산업 투자를 통해 10개 이상의 스타트업 기업에 투자했습니다. 모델 "Lingxin Intelligence"는 레이어 기업이고, "Wall-Facing Intelligence"는 AI 모델 레이어 기업이고, "Power Law Intelligence"는 지능형 법률 서비스 제품 제공업체이며, "Zhiyibi"는 대규모 엔터프라이즈 모델 서비스 플랫폼입니다. Sudaozhi"는 소프트웨어 및 정보 기술 서비스 제공업체입니다. "계산", 생성 AI 애플리케이션 제공업체인 "Shengshu Technology" 등이 있습니다.

Zhang Peng은 Zhipu AI의 미래에 대해 매우 낙관적입니다. "2024년에는 대형 모델 시장이 야만적인 성장에서 벗어나 평온한 상태로 돌아올 것입니다. 대형 모델에 대한 투자와 과대광고는 끝나고 업계의 초점은 모델에서 옮겨갈 것입니다. 그러나 이는 대형 모델의 기술 진화 속도가 느려지고 상향 탐색의 한계에 도달하지 못한다는 의미는 아닙니다.

이 기사는 WeChat 공개 계정 "DoNews"(ID: ilovedonews) 에서 가져온 것입니다. 저자: Zhang Yu, 36 Krypton은 허가를 받아 게시되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
2
즐겨찾기에 추가
코멘트