알리바바 클라우드, 페이페이 리 팀의 S1 모델이 Qwen 훈련 기반임을 확인

02-06

이 기사는 기계로 번역되었습니다

원문 표시

피에이뉴스(PANews) 2월6일 소식에 따르면, 새로운 인공지능 추론 모델 s1이 스탠퍼드 대학과 워싱턴 대학 연구진에 의해 50달러 미만의 클라우드 컴퓨팅 비용으로 훈련되었다고 합니다. 이 모델은 수학 및 코딩 능력 테스트에서 OpenAI의 o1과 DeepSeek의 R1 등 최첨단 추론 모델과 유사한 성능을 보여 큰 관심을 받고 있습니다. 그러나 곧 이 s1 모델이 "처음부터 훈련된 것이 아니"라는 지적이 있었습니다. 이에 대해 알리 클라우드 측은 이 모델이 "알리 통의천문(Qwen) 모델"을 기반으로 했다고 확인했습니다. 또한 알리 클라우드는 이 모델이 16개의 H100 GPU에서 26분간 감독 미세 조정을 거쳐 새로운 s1-32B 모델을 만들었으며, OpenAI의 o1과 DeepSeek의 R1 등 최첨단 추론 모델과 동등한 수학 및 코딩 능력을 보였고, 심지어 경쟁 수학 문제에서는 o1-preview보다 27% 높은 성과를 냈다고 밝혔습니다.