近年来,美国政府不断强化对中国的高阶晶片出口管制,以遏制中国在人工智慧(AI)领域的技术发展。然而,中国 AI 企业 DeepSeek 近期推出的 AI 模型,却展现了接近美国前沿技术水准的能力,且训练成本更低。这是否意味著美国的出口管制措施失效?或者,这些政策仍然是维持技术领先的关键?
Anthropic 执行长 Dario Amodei 近日 (1/30) 针对 DeepSeek 的发展发表看法,认为中国 AI 企业的进步虽然引起关注,但并未动摇出口管制的核心目标。相反地,这些发展进一步凸显了出口管制对于美国 AI 竞争优势的战略价值。
Table of Contents
Toggle美国 AI 优势与出口管制的战略意义
Dario Amodei 表示,美国的出口管制政策旨在确保民主国家能够在 AI 领域保持技术优势,而不是单纯阻止中国的技术发展。
长远来看,美国 AI 企业必须透过技术创新,维持对中国的领先地位。然而,既然中国 AI 企业仍然在受限的算力条件下取得进展,美国是否应该放宽对中国的技术封锁?Amodei 认为,这样的推论并不成立,反而应该进一步强化现有的出口管制政策。
AI 技术的发展涉及三个核心动态,理解这些动态有助于评估 DeepSeek 的影响,以及美国出口管制的未来方向。
AI 技术发展的三大核心动态
1. AI 模型的规模化效应(Scaling Laws)
AI 模型的效能与训练规模呈线性关系,换言之,当训练资源增加,模型的表现会随之提升。例如,当 AI 训练资金从 100 万美元提升至 1 亿美元,模型在程式设计等认知任务上的表现可能从 20% 提升至 60%。这种成长模式促使 AI 企业不断投入更大的计算资源,以训练更强大的 AI 系统。
2. 技术突破与成本下降(Shifting the Curve)
AI 技术不断出现新的创新,提升模型的运行效率,降低训练成本。例如,对于 AI 演算法或硬体架构的改进,可能让相同规模的 AI 训练成本降低 50%。然而,这并不代表 AI 企业会减少投资,反而会将节省下来的资源投入更大规模的训练,以开发更强的 AI。研究显示,近年来 AI 训练成本的下降速度约为 每年 4 倍,这一趋势仍在持续加快。
3. AI 训练方式的变革(Shifting the Paradigm)
AI 训练方式正不断演变,从 2020 年前后的大规模预训练(Pretraining)转向 2024 年兴起的强化学习(Reinforcement Learning, RL)。这种新方法可显著提升 AI 在数学推理、程式设计等特定领域的表现。目前,这类强化学习技术仍处于早期阶段,因此投资相对较小,但能快速提升 AI 的推理能力。
DeepSeek 的 AI 模型是否改变产业格局?
DeepSeek-V3:工程效率的突破,而非颠覆性创新
DeepSeek 近期推出的 DeepSeek-V3 是一款纯预训练模型,在某些 AI 任务上的表现接近美国顶级模型,但训练成本显著较低。DeepSeek 的技术创新主要集中在工程优化,例如 Key-Value Cache 优化以及对专家混合模型(Mixture of Experts, MoE) 的改进,使 AI 模型能够更有效地分配计算资源。
然而,外界对 DeepSeek-V3 的评价存在夸大成分。部分报导声称,DeepSeek 仅以 600 万美元成本就达到了美国 AI 公司投入数十亿美元才能实现的水准。然而,以 Claude 3.5 Sonnet 为例,其训练成本约为数千万美元,且 DeepSeek-V3 的效能仍然落后于美国的先进 AI 模型。
AI 训练成本的下降趋势已存在多年,研究显示 AI 训练成本约每年下降 4 倍,因此 DeepSeek 的进展符合此趋势,并非技术颠覆。
R1:强化学习技术的应用,而非革命性进展
DeepSeek 在 V3 之后推出 R1,这是一款经过强化学习微调的 AI 模型,在数学推理和程式设计等领域表现更佳。然而,这项技术与 OpenAI 先前推出的 o1-preview 类似,并未带来全新的 AI 训练方法,因此并不构成真正的技术突破。
出口管制:防止 AI 竞争失衡的关键
未来 AI 竞争:单极 vs. 双极格局
DeepSeek 的进步引发了一个重要问题:未来 AI 竞争将呈现单极世界,还是双极世界?
- 双极世界:若中国能取得数百万颗先进晶片,美中 AI 技术将并驾齐驱,可能导致全球科技格局更加不稳定。
- 单极世界:若中国无法获取足够的计算资源,美国将保持 AI 技术领先地位,进一步巩固全球科技霸主地位。
目前,美国 AI 企业拥有 数百万颗高阶 GPU 进行 AI 训练,而中国的 AI 计算能力则受限于出口管制政策。
出口管制政策的成效
DeepSeek 拥有约 5 万颗 Hopper GPU,这些晶片主要来自管制前的出货,或属于未被禁止的型号(如 H20)。这显示美国的出口管制仍然发挥作用,且美国政府正在封堵技术漏洞,以进一步限制中国获取关键算力。
美国的出口管制政策旨在防止中国取得 数百万颗晶片,而非完全阻止其获取 AI 硬体。如果中国无法突破这一门槛,美国将维持 AI 领先地位,进一步塑造全球技术竞争格局。
出口管制依然至关重要
DeepSeek 的进步并不代表美国的出口管制政策失败,反而证明其仍然有效。美国应持续强化技术封锁,避免中国获得足够的计算资源来超越美国 AI 技术。未来 AI 竞争的核心,不只是技术创新,更是算力竞争,而出口管制仍然是美国维持技术优势的关键工具。
风险提示
加密货币投资具有高度风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。