이 기사는 기계로 번역되었습니다
원문 표시

엔비디아 루빈 CPX의 출시가 기본 주문량 충족 실패로 인해 연기되었습니다. 엔비디아는 지난 9월 루빈 CPX의 설계 로드맵을 공개하며 2026년 말 출시를 예상했었습니다. 하지만 올해 3월 GTC에서 발표된 어떤 슬라이드나 의제에서도 루빈 CPX 가속기 대한 언급이 전혀 없어 프로젝트가 취소된 것이 아니냐는 추측이 제기되었습니다. 이후 엔비디아 부사장 이안 벅은 ComputerBase와의 인터뷰에서 루빈 CPX가 "출시가 연기"되었으며 파인만 세대(2028년 출시 예정)에 맞춰 개발 중이라고 확인했습니다. CPX의 경제성 핵심은 GDDR과 HBM 간의 차익거래를 통해 얻은 결과물이라는 점입니다. 즉, 대역폭 요구량이 낮은 연산 집약적 애플리케이션의 사전 준비 작업을 위해 저렴하고 용량이 큰 메모리를 사용하는 것입니다. GDDR7의 절대 가격이 DRAM 가격 상승 주기(소비자용 DRAM은 1분기에 75~80%, 2분기에 45~50% 추가 상승)에 따라 움직이게 되면, 이러한 판매 강점은 실제로 손상됩니다. NVIDIA가 공식적으로 밝힌 취소 이유는 워크로드 구조의 변화입니다. 이안 벅의 원래 말: CPX는 TTFT만 개선할 뿐 실제 토큰 속도는 개선하지 않으며, 사전 채우기는 전체 작업량에서 점유비율 비율이 매우 작습니다. 에이전트 간 통신, 400~500K KV 컨텍스트, 초당 1000개 토큰이라는 새로운 시나리오에서는 병목 현상이 사전 채우기 지연 시간에서 디코딩 처리량으로 이동합니다. thelec.net/news/articleView.ht...

Twitter에서
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트