DeepSeek란 무엇인가요? ChatGPT의 중국 경쟁자가 세계를 강타하고 있습니다.

이 기사는 기계로 번역되었습니다
원문 표시

딥시크(DeepSeek), 중국 스타트업이 강력한 오픈 소스 기반의 대규모 언어 모델로 기술 업계에 큰 인상을 남겼습니다.

딥시크는 6백만 달러의 하드웨어 비용으로 강력한 AI를 개발할 수 있다는 것을 입증하며 AI 산업을 뒤흔들었습니다. 이는 수십억 달러를 투자한 OpenAI, 구글, 마이크로소프트와 대조됩니다.

딥시크는 1985년생 투자자이자 기업가인 량원펑(Liang Wenfeng)이 설립한 프로젝트입니다. 그는 저장대학에서 전자정보통신 전공을 했으며, 2015년 항저우에 헤지펀드 High-Flyer Quantitative Investment Management를 공동 설립하며 AI 경력을 시작했습니다. 2023년 딥시크를 설립하여 일반 인공지능(AGI) 발전을 목표로 하고 있습니다.

딥시크는 2023년 11월 29일 첫 번째 대규모 언어 모델 DeepSeek-Coder를 출시했습니다.

그러나 2025년 1월 20일 DeepSeek-R1이 공개되면서 이 회사가 AI 업계를 진정으로 뒤흔들었습니다.

200명도 되지 않는 직원과 6백만 달러의 예산으로 딥시크는 OpenAI의 GPT-o1과 맞먹는 수준의 무료 오픈 소스 모델을 출시했습니다. OpenAI는 6억 달러를 투자하고 3,500명의 인력을 2년간 투입해 이 모델을 개발했습니다.

거대 기술 기업과 달리 딥시크는 신입 졸업생 위주로 인력을 최적화했습니다. "3-5년 경력이 최대이며, 8년 이상 경력자는 거의 배제된다"고 중국 최대 기술 매체 36kr의 채용 전문가가 밝혔습니다.

또한 OpenAI와 다른 주요 AI 모델이 유료 구독 제품으로 제공되는 것과 달리, 딥시크의 소스 코드는 완전히 공개되어 Hugging Face 플랫폼에서 로컬로 실행하거나 모바일 앱을 통해 무료로 사용할 수 있습니다.

딥시크의 기반 기술은 AI 분야의 큰 돌파구로 여겨집니다. 이 모델 출시로 미국 기술 업계가 충격을 받아 단 하루 만에 주요 기업의 시장 가치가 1,000억 달러 증발했습니다.

딥시크의 성공은 독특한 모델 설계 및 학습 접근법에서 비롯됩니다. 병렬 슈퍼컴퓨터처럼 작업을 분할하여 동시에 처리하는 딥시크의 Mixture-of-Experts(MoE) 시스템은 각 작업에 대해 6710억 매개변수 중 약 370억 개만 활성화합니다. 이를 통해 계산 비용을 크게 줄이면서도 다양한 응용 분야에서 최고 수준의 성능을 유지할 수 있습니다.

딥시크는 또한 Group Relative Policy Optimization이라는 강화 학습 기술을 통해 학습 과정을 개선했습니다. 이를 통해 모델의 선택을 유사한 학습 에이전트와 비교하여 의사 결정 능력을 향상시킬 수 있습니다.

딥시크는 MIT 라이선스로 모델을 공개하여 투명성과 접근성을 약속했습니다. 이를 통해 사용자가 모델을 다운로드, 배포, 사용자 정의할 수 있어 독점 시스템을 고수하는 경쟁사와 차별화됩니다. 오픈 소스 모델은 개발자들이 기술을 개선하고 공유할 수 있게 하여 지속적인 발전 및 업그레이드 주기를 만들어냅니다.

딥시크는 저렴한 하드웨어와 다수의 Nvidia A100 GPU를 활용합니다. 추정에 따르면 딥시크는 약 5만 개의 Nvidia GPU에 접근할 수 있는 반면, OpenAI는 ChatGPT 학습에 50만 개의 GPU를 사용했습니다.

많은 AI 전문가들은 딥시크의 모델이 강력하고 효율적이며 비용 효과적이라고 찬사를 보냅니다. 그러나 일부는 프라이버시와 데이터 보안에 대한 우려를 표명하고 있습니다.

"미국 기업이 아닌 곳에서 OpenAI의 초기 미션을 계승하는 것은 믿기 어려운 일입니다. 이는 가장 흥미로운 결과이자 가장 가능성 있는 결과입니다." Nvidia 선임 연구 이사 Jim Fan이 X에 기고했습니다.

OpenAI CEO Sam Altman도 딥시크를 강력한 경쟁자로 인정했습니다.

"우리는 더 나은 모델을 만들어낼 것입니다만, 새로운 경쟁자가 등장한 것은 매우 흥미롭습니다!" Altman이 X에 밝혔습니다.

그러나 며칠 후 OpenAI는 딥시크가 자사의 독점 모델을 불법적으로 사용했다고 주장했습니다.

또한 딥시크는 서비스 약관, 사이버 보안 관행, 중국 정부와의 잠재적 관계 등으로 비판을 받고 있습니다. 일부 전문가는 딥시크가 수집하는 사용자 데이터(기기 모델, 운영 체제, 키보드 패턴, IP 주소 등)에 대해 우려를 표명했습니다.

"중국과 관련된 프라이버시 문제는 항상 존재합니다. 사용자 데이터 수집이 이루어지므로 주의해야 합니다." Appvance CEO Kevin Surace가 말했습니다. "이는 우리 모두가 모델 학습 방식과 AI 운영에 필요한 리소스에 대해 재고해야 함을 의미합니다."

딥시크의 급부상은 서구 기술 기업의 지배력에 도전하고 AI의 미래에 대한 큰 질문을 제기하고 있습니다. 누가 AI를 구축하고 통제할 것이며, AI는 모두에게 개방되고 접근 가능해야 할까요?

그러나 딥시크의 장기적 영향에 대해서는 여전히 의문이 있습니다. 또한 도널드 트럼프 미국 대통령이 TikTok과 유사한 금지 조치로 대응할지도 주목받고 있습니다. High-Flyer가 GPU 성능을 과장하여 딥시크의 효율성을 부풀렸을 가능성도 제기되고 있습니다. 딥시크의 갑작스러운 공개가 Nvidia 주가를 끌어내리려는 투기 목적일 수 있다는 의혹도 있습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트