共计 1335 个字符,预计需要花费 4 分钟才能阅读完成。
近日,Anthropic 首席执行官达里奥·阿莫迪发表了一篇长文,深入分析了中国 AI 公司 DeepSeek 的发展是否对美国构成了实质性威胁,并探讨了其对美国芯片出口管制政策的潜在影响。
阿莫迪指出,DeepSeek 最近推出的“DeepSeek-V3”模型在某些方面表现出了接近美国顶级 AI 模型的能力,但其训练成本显著低于美国同行。尽管如此,他认为 DeepSeek 的成就并未动摇美国在 AI 领域的领导地位,反而强调了加强出口管制的必要性。
AI 发展的三大驱动力
在讨论政策之前,阿莫迪首先概述了推动 AI 系统发展的三大关键动态:扩展定律。AI 的一个重要特性是,在其他条件相同的情况下,扩大训练规模能够全面提升模型在各种认知任务中的表现。例如,随着训练预算的增加,模型解决复杂问题的能力会显著提升。这一趋势促使各大公司不断加大投入,以获取更高效的计算资源和技术。
其次,AI 领域不断涌现的小型和大型创新同样推动了进步。这些创新包括模型架构的优化以及在硬件上更高效地运行模型的方法。此外,新一代硬件设备的引入也加速了这一进程。这些创新共同改变了训练曲线,使得原本需要巨额资金才能完成的任务变得更为经济。
最后,每隔一段时间,AI 领域会出现新的扩展方向。例如,从 2020 年到 2023 年,预训练模型成为主要的研究热点。而在 2024 年,强化学习训练模型以生成思维链的方法逐渐成为新的研究焦点。
DeepSeek 模型的解析
DeepSeek 近期发布了两个版本的模型:“DeepSeek-V3”和“R1”。其中,“DeepSeek-V3”是一个纯预训练模型,表现出色,尤其是在一些关键任务上的表现接近美国最先进模型,同时训练成本大幅降低。该成果得益于 DeepSeek 团队在工程效率方面的多项创新,特别是在键值缓存管理和专家混合方法上的改进。
然而,阿莫迪指出,DeepSeek 的成就并未达到外界预期的高度。他提到,DeepSeek 的模型性能实际上相当于 7 -10 个月前美国模型的水平,尽管成本较低,但差距依然存在。这表明 DeepSeek 的进展符合行业内的成本降低趋势,并非革命性的突破。
出口管制的意义
阿莫迪认为,DeepSeek 的成功不应被视为出口管制政策失效的证据。相反,它凸显了出口管制的重要性和紧迫性。他指出,美国实验室尚未完全掌握 DeepSeek 所采用的一些效率提升技术,而这些技术很快将被全球范围内的研究机构应用。因此,确保美国在 AI 领域的领先地位需要持续的出口管制措施。
阿莫迪强调,出口管制的目标是让美国始终处于 AI 发展的前沿。即使 DeepSeek 取得了显著进展,中国在获取数百万芯片方面仍面临巨大挑战。如果出口管制能够有效实施,美国及其盟友有望在未来几年继续保持单极世界的地位。
此外,阿莫迪提到,DeepSeek 的成就并未表明出口管制存在漏洞。相反,这表明出口管制政策正在逐步完善,漏洞正被逐一填补。通过快速响应新技术的发展,美国可以增强其在全球 AI 竞赛中的竞争优势。
结论
综上所述,DeepSeek 的发布并未改变 AI 发展的基本规律,也不应被视为对美国领导地位的威胁。相反,它强调了出口管制在维护美国 AI 霸权中的关键作用。只有通过严格的出口管制措施,才能确保美国及其盟友在全球科技竞争中占据有利位置。