DeepSeek V3-0324는 오픈 소스 최초로 비추론 AI 모델을 능가합니다.

avatar
AI News
03-25
이 기사는 기계로 번역되었습니다
원문 표시

DeepSeek V3-0324는 오픈소스 AI의 획기적인 성과를 이루며 인공 분석 지능 지수 에서 가장 높은 점수를 받은 비추론 모델이 되었습니다.

새로운 모델은 벤치마크에서 7포인트 앞서 나가 Google의 제미니(Gemini) 2.0 Pro , Anthropic의 Claude 3.7 Sonnet , Meta의 Llama 3.3 70B 등 독점형 경쟁 제품을 능가했습니다.

V3-0324는 DeepSeek의 R1과 OpenAI 및 Alibaba 의 제품을 포함한 추론 모델에 비해 뒤처졌지만, 이 성과는 즉각적인 대응이 중요한 지연에 민감한 애플리케이션에서 오픈소스 솔루션의 실행 가능성이 커지고 있음을 보여줍니다.

DeepSeek V3-0324는 오픈소스 AI의 새로운 시대를 대표합니다.

심의적 "생각" 단계 없이 즉시 답변을 생성하는 비추론 모델은 챗봇, 고객 서비스 자동화, 실시간 번역과 같은 실시간 사용 사례에 필수적입니다. DeepSeek의 최신 반복은 이제 이러한 애플리케이션의 표준을 설정하여 선도적인 독점 도구조차 능가합니다.

비추론적 오픈소스 AI 모델에 대한 획기적인 성과를 보여주는 인공지능 분석 지능 지수의 DeepSeek V3-0324 벤치마크 결과입니다.

Artificial Analysis는 "이것은 오픈 가중치 모델이 선두적인 비추론 모델이 된 첫 번째 사례이며, 오픈 소스의 이정표"라고 말합니다. 이 모델의 성능은 독점적 추론 모델에 더 가깝지만, 후자는 복잡한 문제 해결이 필요한 작업에서는 여전히 더 뛰어납니다.

DeepSeek V3-0324는 다음을 포함하여 2024년 12월 이전 모델의 대부분 사양을 그대로 유지합니다.

  • 128k 컨텍스트 창(DeepSeek의 API를 통해 64k로 제한됨)
  • 총 6710억 개의 매개변수, FP8 정밀도를 위해 700GB 이상의 GPU 메모리 필요
  • 370억개의 활성 매개변수
  • 텍스트 전용 기능(멀티모달 지원 없음)
  • MIT 라이센스

"아직도 집에서 실행할 수 있는 것은 아닙니다!" Artificial Analysis는 기업급 인프라 요구 사항을 강조하며 재치있게 말합니다.

오픈소스 AI가 열을 가져오고 있습니다

DeepSeek R1 과 같은 독점적 추론 모델이 더 광범위한 지능 지수에서 지배적인 위치를 유지하고 있지만 그 격차는 줄어들고 있습니다.

3개월 전, DeepSeek V3는 Anthropic과 Google의 독점 모델과 거의 비슷했지만, 그들을 능가하는 데는 숏 . 오늘날 업데이트된 V3-0324는 오픈소스 대안을 선도할 뿐만 아니라 모든 독점적 비이성적 경쟁자보다 성능이 뛰어납니다.

Artificial Analysis는 "이 릴리스는 R1보다 훨씬 더 인상적이라고 할 수 있다"고 말했습니다.

DeepSeek의 진전은 오픈소스 프레임워크가 폐쇄 시스템과 경쟁하는 AI 부문의 변화를 알립니다. 개발자와 기업을 위해 MIT 라이선스 V3-0324는 강력하고 적응 가능한 도구를 제공하지만, 컴퓨팅 비용이 접근성을 제한할 수 있습니다.

Artificial Analysis는 "DeepSeek은 이제 비추론적 개방형 가중치 모델의 최전선을 달리고 있습니다."라고 선언합니다.

R2가 눈앞에 다가오면서, 커뮤니티는 AI 성능의 또 다른 잠재적 도약을 기대하고 있습니다.

(사진: 폴 하나오카 )

또한 참조: Hugging Face는 AI 액션 플랜에서 오픈 소스에 초점을 맞출 것을 촉구합니다.

업계 리더로부터 AI와 빅데이터에 대해 더 자세히 알아보고 싶으신가요? 캘리포니아 암스테르담과 런던에서 열리는 AI & Big Data Expo를 확인해 보세요. 이 포괄적인 이벤트는 Intelligent Automation Conference , BlockX , Digital Transformation Week , Cyber ​​Security & Cloud Expo 를 포함한 다른 주요 이벤트와 함께 진행됩니다.

여기에서 TechForge가 제공하는 다른 기업 기술 이벤트와 웨비나를 확인해 보세요.

DeepSeek V3-0324가 오픈 소스에서 비추론 AI 모델을 앞지르다는 기사가 AI News 에 처음 게재되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트