本周,两家美国人工智能实验室发布了开源模型,但各自采用截然不同的方法来解决同一个问题:如何与中国在公共人工智能系统领域的统治地位竞争。
Deep Cogito 发布了 Cogito v2.1,这是一个拥有 6710 亿个参数的庞大模型,其创始人 Drishan Arora 称之为“美国公司最好的开放权重 LLM”。
艾伦人工智能研究所反驳道,事情并非如此简单。该研究所刚刚发布了 Olmo 3,并称其为“最佳完全开源的基础模型”。Olmo 3 标榜完全透明,包括其训练数据和代码。
具有讽刺意味的是,Deep Cognito 的旗舰模型却是建立在中国的技术基础上的。Arora 在 X 大会上承认,Cogito v2.1 “从 2024 年 11 月起,基于开源的 Deepseek 基础模型进行了分支”。
这引发了一些批评,甚至引发了关于微调中国模型是否算作美国人工智能进步,或者这是否仅仅证明了美国实验室落后了多少的争论。
https://t.co/wHcfNQIJzJ pic.twitter.com/N7x1eEsjhF
— 卢卡·索尔代尼 (Luca Soldaini) 🎀 (@soldni) 2025 年 11 月 19 日
美国公司推出的最佳公开组LLM
这很酷,但我不确定是否应该强调“美国”部分,因为基础型号是 DeepSeek V3 https://t.co/SfD3dR5OOy
— Elie (@eliebakouch) 2025 年 11 月 19 日
无论如何,Cogito 相对于 DeepSeek 的效率提升是真实存在的。
Deep Cognito 声称 Cogito v2.1 生成的推理链比 DeepSeek R1 短 60%,同时保持了具有竞争力的性能。
Arora 称之为“迭代提炼和放大”——通过自我改进循环来训练模型,使其发展出更好的直觉——这家初创公司仅用了 75 天就利用 RunPod 和 Nebius 的基础设施训练出了自己的模型。
如果基准测试结果属实,这将是目前由美国团队维护的最强大的开源LLM。
为什么这很重要
到目前为止,中国在开源人工智能领域一直处于领先地位,美国公司为了保持竞争力,越来越依赖中国的基础模型——无论是悄悄地还是公开地。
这种动态存在风险。如果中国实验室成为全球开放人工智能的默认平台,美国初创企业将失去技术独立性、议价能力以及制定行业标准的能力。
开放权重人工智能决定谁控制着下游所有产品所依赖的原始模型。
目前,中国开源模型(DeepSeek、Qwen、Kimi、MiniMax)在全球范围内占据主导地位,因为它们价格低廉、速度快、效率高,并且不断更新。

许多美国初创公司已经利用了这些技术,即使他们公开否认这一点。
这意味着美国企业正在利用外国的知识产权、培训体系和硬件优化技术来构建业务。从战略角度来看,这使美国重蹈覆辙,再次面临半导体制造领域的困境:越来越依赖他国的供应链。
Deep Cogito 的方法——从 DeepSeek 的一个分支开始——展现了其优点(快速迭代)和缺点(依赖性)。
艾伦研究所的做法——以完全透明的方式构建 Olmo 3——展现了另一种选择:如果美国想要在开放人工智能领域占据领先地位,就必须从数据、训练方案到检查点,重建整个技术栈。这需要耗费大量人力,而且耗时较长,但却能确保美国对底层技术的自主权。
理论上,如果您已经喜欢 DeepSeek 并在线使用它,Cogito 大多数情况下都能提供更好的答案。如果您通过 API 使用 Cogito,您会更加满意,因为其效率更高,您只需花费更少的费用就能获得高质量的回复。
艾伦研究所采取了截然相反的做法。Olmo 3 系列模型全部与 Dolma 3 一同发布,Dolma 3 是一个从零开始构建的包含 5.9 万亿个标记的训练数据集,此外还包括完整的代码、配方以及每个训练阶段的检查点。
该非营利组织发布了三种模型变体——基础模型、思考模型和指导模型——分别具有 70 亿和 320 亿个参数。
该研究所写道:“人工智能领域的真正开放不仅仅关乎获取途径,更关乎信任、问责和共同进步。”
Olmo 3-Think 32B 是第一个达到如此规模的完全开放推理模型,它使用大约只有 Qwen 3 等类似模型六分之一的标记进行训练,同时取得了具有竞争力的性能。

Deep Cognito 于 8 月获得由 Benchmark 领投的 1300 万美元种子轮融资。这家初创公司计划发布参数量高达 6710 亿的前沿模型,这些模型将使用“更强大的计算能力和更好的数据集”进行训练。
与此同时,英伟达为 Olmo 3 的开发提供了支持,副总裁 Kari Briski 称其对于“开发者利用开放的、美国制造的模型来扩展 AI”至关重要。
该研究所使用谷歌云的 H100 GPU 集群进行训练,计算需求比 Meta 的 Llama 3.1 8B 减少了 2.5 倍。
Cogito v2.1 可在此处免费在线测试。该模型可在此处下载,但请注意:它需要性能非常强大的显卡才能运行。
Olmo 可在此处进行测试。模型可在此处下载。这些模型对用户更加友好,具体取决于您选择哪一个。




