저자: Sam Gao, ElizaOS의 저자
0. 서문
DeepSeek R1의 완전한 오픈소스(HuggingFace에서 무료로 모델을 다운로드하여 로컬에서 추론 가능)와 극저렴한 가격(OpenAI o1의 1/100 수준)으로 인해 DeepSeek는 단 5일 만에 미국 Apple AppStore 1위에 올랐습니다.

그렇다면 이 신비로운 중국 퀀트 회사에서 배출된 AI 신흥 세력은 어디서 왔을까요?
1. DeepSeek의 기원
2023년 초, 지식재산, 달의 어두운 면, 백천 지능 등을 대표하는 6개 회사가 중관촌과 오도구 사이의 화려한 무대에 등장하면서 DeepSeek의 존재감이 크게 가려졌습니다.

2023년, 순수 연구 기관인 DeepSeek는 유명 창업자가 없어 시장에서 자금 조달이 어려웠습니다. 따라서 High-Flyer Quant는 DeepSeek를 분리하고 전액 지원하기로 했습니다.

2. 인재 전략
DeepSeek는 대부분 박사과정생이나 졸업 3년 이내의 매우 젊은 연구원들로 구성되어 있습니다. 이들은 대부분 북경 지역에서 석/박사 과정을 밟은 학생들로, 학술적으로 뛰어난 업적을 가지고 있습니다.


경험이 없는 젊은 인재를 선호하는 DeepSeek의 전략은 OpenAI의 초기 전략과 유사합니다. 이러한 "어린 늑대 전략"은 OpenAI에게 많은 성과를 가져다주었습니다.

3. DeepSeek를 위한 변론
DeepSeek R1의 성능 지표는 매우 뛰어나지만, 두 가지 의문이 제기되고 있습니다. 첫째, 이렇게 뛰어난 성능을 어떻게 달성했는지, 둘째, 이렇게 젊은 연구원들이 어떻게 이런 성과를 낼 수 있었는지입니다.
① 它所使用的专家混合 (MoE)技术,对训练要求高,对数据要求高,这表明了,大家质疑Deepseek使用OpenAI数据训练是有道理的。
② Deepseek使用强化学习 (RL)的强化学习技术,有对硬件要求很高,但相比Meta,OpenAI的万卡集群,Deepseek的训练只用了2048张H800。
由于算力的限制和MoE的复杂性,这让只用500万美元就一次成功的DeepSeek R1看着有些可疑,但是,无论你对R1的态度是顶礼膜拜其"低成本奇迹",还是质疑其"华而不实",都无法忽视其功能性创新的炫目。
BitMEX联合创始人Arthur Hayes发文表示: DeepSeek崛起是否会导致全球投资者质疑美国超卓主义?美国的资产价值是否被严重高估?
斯坦福大学教授吴恩达在今年的达沃斯论坛公开表示: "我对 DeepSeek 的进展印象深刻。我认为他们能够以非常经济的方式训练模型。他们最新发布的推理模型,非常出色……'加油'!"
A16z的创始人,Marc Andreessen表示,"Deepseek R1 是我见过的最令人惊叹、最令人印象深刻的突破之一——而且作为开源,它是给世界的一份深刻的礼物。"

2023年站在舞台角落的DeepSeek,终于在2025年,农历春节前,站上了世界AI之巅.
4.Argo和DeepSeek
作为Argo的技术开发者和AIGC研究者,我将Argo里面的重要功能进行了DeepSeek化: 作为一个工作流(workflow)系统,粗糙的原始工作流生成工作,Argo是用DeepSeek R1进行的。此外,Argo将LLM内置为标准的DeepSeek R1,并选择抛弃闭源昂贵的OpenAI模型,原因是Workflow系统通常包含大量的Token消耗和上下文信息(平均>=10k token),这就导致了如果使用高价的OpenAI或Claude 3.5,Workflow的执行成本非常昂贵,在web3用户没有得到真正的价值捕获之前,这种提前透支的花销,是一种对产品的伤害。
随着DeepSeek越来越好,Argo会和DeepSeek为代表的中国力量进行更密切的合作: 包括不限于Text2Image/Video接口的中国化,LLM的中国化。
在合作方面,Argo将会在未来邀请DeepSeek的研究员分享技术成果,并为顶级AI研究员提供grants,为web3投资人和用户了解AI进展,提供助力。





