오늘날 OpenAI는 ChatGPT-3.5를 죽입니다.

36氪

07-20

이 기사는 기계로 번역되었습니다

원문 표시

GPT-4o mini는 싸다! 10명의 동료가 경쟁하는데, OpenAI와 경쟁할 수 있는 사람은 누구일까요?

편집됨 | 리수이칭

편집 |

GPT-4o의 새 버전은 1백만 토큰당 1위안 으로 떨어졌습니다. OpenAI를 능가하는 것은 OpenAI입니다!

Zhidongxi는 7월 18일 저녁 OpenAI가 가장 저렴한 모델 인 GPT-4o mini를 출시했다고 19일 보도했습니다. OpenAI를 포함한 국내외 10개 제조업체의 대형 모델 API 최신 가격을 즉시 비교한 결과, 이번에는 다른 동료들이 스트레스를 많이 받고 있어요.

GPT-4o 미니 API 입력 가격은 15센트(약 RMB 1.09)/백만 토큰 이고 출력 가격은 60센트(약 RMB 4.36)/백만 토큰으로 GPT-3.5 Turbo보다 60% 저렴합니다. 그 능력은 GPT-3.5 Turbo를 크게 능가하여 MMLU 테스트에서 82% 라는 좋은 점수를 얻었고, LMSYS 순위의 채팅 선호도에서는 GPT-4를 능가했습니다 .

이전에는 대형 모델의 가격이 비싸기 때문에 많은 개발자가 Google의 Gemini 1.5 Flash 및 Anthropic의 Claude 3 Haiku 와 같은 소형 모델로 눈을 돌렸습니다. 이제 이 모델은 GPT-4o mini에 의해 "저격"되었습니다.

▲GPT-4o mini는 다른 소형 모델에 비해 훨씬 가성비가 좋다. (출처:인공분석)

아래 표에서 볼 수 있듯이 Zhixixi 통계에 따르면 GPT-4o mini의 현재 가격은 Gemini 1.5 Flash 의 입력 가격 2.5위안/백만 토큰 및 출력 가격 7.6위안/백만 토큰 보다 훨씬 낮습니다. Claude 3 Haiku 보다 낮습니다 . 입력 가격은 1.8위안/백만 토큰, 출력 가격은 9위안/백만 토큰 이며 성능이 모든 측면에서 압도됩니다.

동시에 위 표에서 볼 수 있듯이 Deep Search, Zhipu AI, ByteDance, Alibaba Cloud, Baidu, ByteDance, Tencent Cloud, iFlytek 등과 같은 국내 제조업체는 자사 모델의 가격을 순차적으로 크게 인하했습니다. 6월이지만 지금은 가격 우위도 약화됐다.

예를 들어 Alibaba Cloud Qwen-Turbo의 입력 가격은 2위안/백만 토큰이고 출력 가격은 6위안/백만 토큰입니다. Baidu ERNIE 3.5 시리즈의 입력 가격은 12위안/백만 토큰, 출력 가격은 12위안입니다. /백만 토큰. Byte Doubao- pro-128k의 입력 가격은 5위안/백만 토큰이고 출력 가격은 9위안/백만 토큰입니다... GPT-4o mini 앞에는 가격 대비 성능 비율이 큽니다. 물음표.

OpenAI CEO인 Sam Altman은 GPT-4o mini가 " 저렴하고 측정할 수 없는 지능을 향해 나아가고 있다"고 말했습니다.

▲OpenAI CEO 샘 알트만(Sam Altman)이 소셜 플랫폼 X에 게시한 글

OpenAI 발표에 따르면, GPT-4o mini의 토큰 비용은 2022년 상대적으로 기본적인 기능을 갖춘 GPT-3 의 text-davinci-003 모델에 비해 99% 감소 했습니다.

현재 GPT-4o mini는 ChatGPT에서 무료로 출시 되었으며 점차적으로 GPT-3.5를 대체할 것으로 예상됩니다.

01 .

GPT-3.5 Turbo 따라잡아 소형모델 타이틀 획득

GPT-4o mini는 저비용, 저지연 특성을 갖고 있으며 연결 또는 병렬 모델 호출, 대량 컨텍스트 처리, 빠른 실시간 텍스트 상호 작용 등 다양한 작업이 가능합니다.

128k 토큰의 컨텍스트 처리 기능을 갖추고 있으며 이미 API에서 텍스트 및 시각적 입력을 지원하고 16k 출력 토큰을 지원하며 향후 비디오 및 오디오 입/출력으로 확장될 예정입니다.

여러 글로벌 권위 있는 벤치마크 테스트에서 GPT-4o mini는 자체 GPT-3.5 Turbo 및 여러 소형 모델을 능가했습니다.

MMLU 텍스트 인텔리전스 및 추론 벤치마크에서 GPT-4o mini는 82.0% 의 점수로 선두를 달리고 있으며 Gemini Flash와 Claude Haiku는 각각 77.9%와 73.8%를 기록했습니다.

MGSM 수학적 추론 테스트에서 GPT-4o mini는 87.0% 라는 높은 점수를 얻어 Gemini Flash의 75.5% 와 Claude Haiku의 71.7%를 훨씬 능가했습니다.

HumanEval 인코딩 성능 테스트에서도 GPT-4o mini가 87.2% 의 우수한 점수로 선두를 차지했으며, Gemini Flash와 Claude Haiku는 각각 71.5%와 75.9%를 기록했습니다.

다중 모드 추론 분야에서는 GPT-4o mini가 MMMU 평가에서 59.4%를 기록해 Gemini Flash의 56.1% 와 Claude Haiku의 50.2%를 앞섰습니다.

GPT-4o mini는 영수증에서 구조화된 데이터를 클레임 대화 기록을 기반으로 고품질 이메일 응답을 생성하는 등의 작업을 수행할 때 GPT-3.5 Turbo보다 훨씬 뛰어난 성능을 보였습니다 .

GPT -4o mini는 어젯밤에 출시되었습니다 . AI 전문가인 Andrej Karpathy는 소셜 플랫폼에서 2-매개변수 수준 모델이 이미 '사고'에 매우 뛰어나고 신뢰할 수 있다고 말했습니다 . "

▲AI 마스터 Andrej Karpathy가 소셜 플랫폼 X에 게시했습니다.

02 .

API 입력 가격은 1위안 정도로 저렴하며 ChatGPT에서 무료로 출시되었습니다.

GPT-4o mini는 이제 공식적으로 온라인에 있으며 개발자가 사용할 수 있도록 Assistants API, Chat Completions API 및 Batch API에 통합되었습니다.

수수료 측면에서 GPT-4o mini의 입력 가격은 15센트(약 1.09위안)/백만 토큰이고 출력 가격은 60센트(약 4.36위안)/백만 토큰 으로 약 2,500만 토큰을 처리하는 것과 거의 같습니다. 표준 도서 콘텐츠 페이지 의 비용.

OpenAI는 앞으로 며칠 내에 GPT-4o mini에 대한 미세 조정 기능을 출시할 계획입니다.

ChatGPT 사용자의 경우 무료 버전, 플러스 버전, 팀 버전 등 오늘부터 점차적으로 GPT-3.5를 대체 할 GPT-4o mini를 경험할 수 있습니다. 기업 사용자도 다음 주부터 이 업그레이드에 액세스할 수 있습니다.

OpenAI는 GPT-4o mini가 GPT-4o와 동일한 엄격한 보안 보호 메커니즘을 상속한다고 밝혔습니다. 사전 훈련 단계에서 잘못된 정보를 걸러내고, 훈련 진입 후에는 강화 학습, 수동 피드백(RLHF) 등의 기술을 사용하여 모델 동작이 보안 정책과 더욱 일치하도록 만듭니다.

OpenAI 명령 계층 방식을 적용한 최초의 모델 인 GPT-4o mini는 API에서 더욱 강력한 방어 능력을 보여 탈옥 공격, 즉시 주입, 즉시 시스템 클레임 등의 리스크 효과적으로 저항합니다.

OpenAI는 GPT-4o mini의 사용을 지속적으로 모니터링하고 새로운 리스크 발견되면 모델 보안을 개선하기 위한 즉각적인 조치를 취할 것입니다.

OpenAI는 발표 말미에 9명의 팀 리더 의 이름을 첨부했습니다. 그 중 Shengjia Zhao, Hongyu Ren, Haitang Hu, Mianna Chen, Kevin Lu는 모두 중국인입니다 . 그들은 Tsinghua University, Peking University, Tongji University를 졸업했습니다. 등 국내 유명 대학.

03 .

결론: 모델 사이즈 경쟁 역전, 가격 전쟁 심화

대형 모델 가격 전쟁이 격화된다. 2022년 상대적으로 기본적인 기능을 갖춘 GPT-3의 text-davinci-003 모델과 비교하면 OpenAI의 GPT-4o mini의 토큰 가격은 99% 하락했습니다. 6월.

OpenAI는 신제품을 출시할 때마다 동료들에게 압력을 가합니다. 같은 날 Nvidia와 프랑스 스타 AI 유니콘 Mistral도 공동으로 Llama 3 8B를 능가하는 성능을 갖춘 Mistral NeMo라는 소형 컵 모델을 출시했습니다. 더 낮은 비용과 더 높은 성능을 갖춘 더 작은 모델의 출현은 AI를 보다 일상적인 시나리오에 원활하게 통합하는 것을 촉진하고 업계가 AI 구현에 대해 다른 관점에서 생각할 수 있게 해줄 것입니다.

이 기사는 WeChat 공개 계정 "Zhidixi"(ID: zhidxcom) , 작성자: Li Shuiqing, 36 Krypton에서 승인을 받아 게시되었습니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트