DeepSeek V4, 엔비디아를 거부하고 화웨이로 눈을 돌렸다! 알리바바, 바이트댄스, 텐센트, Ascend 950PR 칩 구매 경쟁 벌여.

04-04

이 기사는 기계로 번역되었습니다

원문 표시

중국 최대 기술 기업 3곳이 동일한 칩을 확보하기 위해 경쟁하고 있습니다. 알리바바, 바이트댄스, 텐센트는 화웨이에 Ascend 950PR 칩을 수십만 개 대량 주문했습니다. 이 칩의 양산은 이번 달에야 시작되었으며, 화웨이의 연간 덤핑 목표는 약 75만 개입니다. 이 3대 기업의 집중적인 구매로 인해 950PR 칩 가격은 최근 몇 주 동안 20% 상승했습니다.

이러한 구매 열풍의 촉발 요인은 DeepSeek V4였습니다. 세 회사는 V4 공식 출시 후 클라우드 서비스를 통해 기업과 개발자에게 모델을 배포하고 각자의 AI 애플리케이션에 통합할 계획이었습니다.

950PR의 가격은 약 5만 위안(약 6,900달러)이며, HBM 메모리를 탑재한 고급형은 7만 위안까지 오르지만, 이러한 가격에도 불구하고 구매 열풍은 멈추지 않고 있습니다.

DeepSeek V4는 엔비디아 제품을 배제하고 화웨이 제품과의 호환성을 우선시합니다.

이러한 주문 폭증의 이면에는 더 큰 전략적 의미가 숨겨져 있습니다. 2월 25일 로이터 통신 의 단독 보도에 따르면, 딥시크는 V4 출시 전 화웨이와 같은 중국 칩 제조업체에만 사전 접근 기회를 제공했으며, 엔비디아와 AMD의 참여는 명시적으로 배제했습니다.

일반적으로 반도체 회사들은 공식 출시 전에 대규모 모델을 미리 확보하여 지원 소프트웨어와 최적화 도구를 준비하는 것이 관례입니다. 이번에 딥시크를 선택함으로써 화웨이는 V4의 공식 출시 전에 소프트웨어 적응에 유리한 위치를 확보할 수 있었고, 엔비디아는 아예 배제되었습니다.

DeepSeek은 또한 화웨이 및 칩 설계 회사인 Cambricon과 협력하여 V4의 하드웨어 최적화를 발전시켜 왔습니다.

DeepSeek V4 주요 사양

DeepSeek V4는 MoE(Mixture-of-Experts) 아키텍처를 채택하여 총 약 1조 개의 참조 데이터를 보유하지만, 추론 시 약 370억 개의 참조 데이터만 사용하여 낮은 지연 시간과 비용을 효과적으로 유지합니다. 이 모델은 텍스트, 이미지, 코드 등 다양한 모달 입력을 지원하며, 최대 100만 개의 토큰으로 구성된 컨텍스트 윈도우를 사용하고 SWE-bench 코드 벤치마크에서 80% 이상의 점수를 달성합니다.

NxCode 의 추산에 따르면 V4 API의 가격은 백만 입력 토큰당 약 0.14달러로, 주요 서구 모델보다 20~50배 저렴합니다.

V4는 원래 2026년 2월 출시 예정이었으나, NVIDIA 아키텍처에서 화웨이 칩으로 마이그레이션하면서 기본 코드를 재작성해야 했기 때문에 여러 차례 연기되었습니다. DeepSeek은 현재 각각 다른 기능을 위해 최적화된 두 가지 V4 변형 버전을 개발 중이며, 두 버전 모두 중국산 칩 아키텍처에 맞춰 설계되었습니다.

V4는 몇 주 안에 출시될 것으로 예상됩니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트