시나 웨이보가 플래그십 모델에 버금가는 30억 개의 파라미터를 자랑하는 바이브씽커-3B를 공개했습니다.

이 기사는 기계로 번역되었습니다
원문 표시

크립토브리핑(CryptoBriefing)에 따르면, 시나 웨이보(Sina Weibo) 연구팀이 VibeThinker-3B 언어 모델을 공개했습니다. 이 모델은 단 30억 개의 파라미터로 AIME 2026 수학 경시대회 벤치마크에서 94.3점을 달성했는데, 이는 6,710억 개의 파라미터를 가진 DeepSeek V3.2와 비슷한 수준입니다. 또한 LiveCodeBench v6 코딩 테스트에서 80.2점의 Pass@1 점수를 기록했습니다. Qwen2.5-Coder-3B 아키텍처를 기반으로 구축된 이 모델은 지도 미세 조정, 다중 도메인 강화 학습, 오프라인 자기 증류 기법을 통해 성능이 향상되었습니다. 모델의 가중치와 코드는 MIT 라이선스 하에 Hugging Face와 GitHub에서 완전히 오픈 소스로 공개되었습니다. 분석 결과, 이처럼 효율적이고 작은 모델은 분산 네트워크에서 실행하기 쉽고 암호화폐 분야의 탈중앙화 AI 프로젝트에 긍정적인 영향을 미칠 것으로 예상됩니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트